home *** CD-ROM | disk | FTP | other *** search
/ Languguage OS 2 / Languguage OS II Version 10-94 (Knowledge Media)(1994).ISO / a_utils / perl / msds-prl / prl386ld.zoo / toke.c < prev   
C/C++ Source or Header  |  1992-07-02  |  62KB  |  2,757 lines

  1. /* $RCSfile: toke.c,v $$Revision: 4.0.1.8 $$Date: 92/06/23 12:33:45 $
  2.  *
  3.  *    Copyright (c) 1991, Larry Wall
  4.  *
  5.  *    You may distribute under the terms of either the GNU General Public
  6.  *    License or the Artistic License, as specified in the README file.
  7.  *
  8.  * $Log:    toke.c,v $
  9.  * Revision 4.0.1.8  92/06/23  12:33:45  lwall
  10.  * patch35: bad interaction between backslash and hyphen in tr///
  11.  * 
  12.  * Revision 4.0.1.7  92/06/11  21:16:30  lwall
  13.  * patch34: expectterm incorrectly set to indicate start of program or block
  14.  * 
  15.  * Revision 4.0.1.6  92/06/08  16:03:49  lwall
  16.  * patch20: an EXPR may now start with a bareword
  17.  * patch20: print $fh EXPR can now expect term rather than operator in EXPR
  18.  * patch20: added ... as variant on ..
  19.  * patch20: new warning on spurious backslash
  20.  * patch20: new warning on missing $ for foreach variable
  21.  * patch20: "foo"x1024 now legal without space after x
  22.  * patch20: new warning on print accidentally used as function
  23.  * patch20: tr/stuff// wasn't working right
  24.  * patch20: 2. now eats the dot
  25.  * patch20: <@ARGV> now notices @ARGV
  26.  * patch20: tr/// now lets you say \-
  27.  * 
  28.  * Revision 4.0.1.5  91/11/11  16:45:51  lwall
  29.  * patch19: default arg for shift was wrong after first subroutine definition
  30.  * 
  31.  * Revision 4.0.1.4  91/11/05  19:02:48  lwall
  32.  * patch11: \x and \c were subject to double interpretation in regexps
  33.  * patch11: prepared for ctype implementations that don't define isascii()
  34.  * patch11: nested list operators could miscount parens
  35.  * patch11: once-thru blocks didn't display right in the debugger
  36.  * patch11: sort eval "whatever" didn't work
  37.  * patch11: underscore is now allowed within literal octal and hex numbers
  38.  * 
  39.  * Revision 4.0.1.3  91/06/10  01:32:26  lwall
  40.  * patch10: m'$foo' now treats string as single quoted
  41.  * patch10: certain pattern optimizations were botched
  42.  * 
  43.  * Revision 4.0.1.2  91/06/07  12:05:56  lwall
  44.  * patch4: new copyright notice
  45.  * patch4: debugger lost track of lines in eval
  46.  * patch4: //o and s///o now optimize themselves fully at runtime
  47.  * patch4: added global modifier for pattern matches
  48.  * 
  49.  * Revision 4.0.1.1  91/04/12  09:18:18  lwall
  50.  * patch1: perl -de "print" wouldn't stop at the first statement
  51.  * 
  52.  * Revision 4.0  91/03/20  01:42:14  lwall
  53.  * 4.0 baseline.
  54.  * 
  55.  */
  56.  
  57. #include "EXTERN.h"
  58. #include "perl.h"
  59. #include "perly.h"
  60.  
  61. static void set_csh();
  62.  
  63. #ifdef I_FCNTL
  64. #include <fcntl.h>
  65. #endif
  66. #ifdef I_SYS_FILE
  67. #include <sys/file.h>
  68. #endif
  69.  
  70. #ifdef f_next
  71. #undef f_next
  72. #endif
  73.  
  74. /* which backslash sequences to keep in m// or s// */
  75.  
  76. static char *patleave = "\\.^$@dDwWsSbB+*?|()-nrtfeaxc0123456789[{]}";
  77.  
  78. char *reparse;        /* if non-null, scanident found ${foo[$bar]} */
  79.  
  80. void checkcomma();
  81.  
  82. #ifdef CLINE
  83. #undef CLINE
  84. #endif
  85. #define CLINE (cmdline = (curcmd->c_line < cmdline ? curcmd->c_line : cmdline))
  86.  
  87. #ifdef atarist
  88. #define PERL_META(c) ((c) | 128)
  89. #else
  90. #define META(c) ((c) | 128)
  91. #endif
  92.  
  93. #define RETURN(retval) return (bufptr = s,(int)retval)
  94. #define OPERATOR(retval) return (expectterm = TRUE,bufptr = s,(int)retval)
  95. #define TERM(retval) return (CLINE, expectterm = FALSE,bufptr = s,(int)retval)
  96. #define LOOPX(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)LOOPEX)
  97. #define FTST(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)FILETEST)
  98. #define FUN0(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC0)
  99. #define FUN1(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC1)
  100. #define FUN2(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC2)
  101. #define FUN2x(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC2x)
  102. #define FUN3(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC3)
  103. #define FUN4(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC4)
  104. #define FUN5(f) return(yylval.ival = f,expectterm = FALSE,bufptr = s,(int)FUNC5)
  105. #define FL(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FLIST)
  106. #define FL2(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FLIST2)
  107. #define HFUN(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)HSHFUN)
  108. #define HFUN3(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)HSHFUN3)
  109. #define LFUN(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LVALFUN)
  110. #define AOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)ADDOP)
  111. #define MOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)MULOP)
  112. #define EOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)EQOP)
  113. #define ROP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)RELOP)
  114. #define FOP(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP)
  115. #define FOP2(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP2)
  116. #define FOP3(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP3)
  117. #define FOP4(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP4)
  118. #define FOP22(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP22)
  119. #define FOP25(f) return(yylval.ival=f,expectterm = FALSE,bufptr = s,(int)FILOP25)
  120.  
  121. static char *last_uni;
  122.  
  123. /* This bit of chicanery makes a unary function followed by
  124.  * a parenthesis into a function with one argument, highest precedence.
  125.  */
  126. #define UNI(f) return(yylval.ival = f, \
  127.     expectterm = TRUE, \
  128.     bufptr = s, \
  129.     last_uni = oldbufptr, \
  130.     (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
  131.  
  132. /* This does similarly for list operators, merely by pretending that the
  133.  * paren came before the listop rather than after.
  134.  */
  135. #ifdef atarist
  136. #define LOP(f) return(CLINE, *s == '(' || (s = skipspace(s), *s == '(') ? \
  137.     (*s = (char) PERL_META('('), bufptr = oldbufptr, '(') : \
  138.     (yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP))
  139. #else
  140. #define LOP(f) return(CLINE, *s == '(' || (s = skipspace(s), *s == '(') ? \
  141.     (*s = (char) META('('), bufptr = oldbufptr, '(') : \
  142.     (yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP))
  143. #endif
  144. /* grandfather return to old style */
  145. #define OLDLOP(f) return(yylval.ival=f,expectterm = TRUE,bufptr = s,(int)LISTOP)
  146.  
  147. char *
  148. skipspace(s)
  149. register char *s;
  150. {
  151.     while (s < bufend && isSPACE(*s))
  152.     s++;
  153.     return s;
  154. }
  155.  
  156. void
  157. check_uni() {
  158.     char *s;
  159.     char ch;
  160.  
  161.     if (oldoldbufptr != last_uni)
  162.     return;
  163.     while (isSPACE(*last_uni))
  164.     last_uni++;
  165.     for (s = last_uni; isALNUM(*s); s++) ;
  166.     ch = *s;
  167.     *s = '\0';
  168.     warn("Warning: Use of \"%s\" without parens is ambiguous", last_uni);
  169.     *s = ch;
  170. }
  171.  
  172. #ifdef CRIPPLED_CC
  173.  
  174. #undef UNI
  175. #undef LOP
  176. #define UNI(f) return uni(f,s)
  177. #define LOP(f) return lop(f,s)
  178.  
  179. int
  180. uni(f,s)
  181. int f;
  182. char *s;
  183. {
  184.     yylval.ival = f;
  185.     expectterm = TRUE;
  186.     bufptr = s;
  187.     last_uni = oldbufptr;
  188.     if (*s == '(')
  189.     return FUNC1;
  190.     s = skipspace(s);
  191.     if (*s == '(')
  192.     return FUNC1;
  193.     else
  194.     return UNIOP;
  195. }
  196.  
  197. int
  198. lop(f,s)
  199. int f;
  200. char *s;
  201. {
  202.     CLINE;
  203.     if (*s != '(')
  204.     s = skipspace(s);
  205.     if (*s == '(') {
  206. #ifdef atarist
  207.     *s = PERL_META('(');
  208. #else
  209.     *s = META('(');
  210. #endif
  211.     bufptr = oldbufptr;
  212.     return '(';
  213.     }
  214.     else {
  215.     yylval.ival=f;
  216.     expectterm = TRUE;
  217.     bufptr = s;
  218.     return LISTOP;
  219.     }
  220. }
  221.  
  222. #endif /* CRIPPLED_CC */
  223.  
  224. int
  225. yylex()
  226. {
  227.     register char *s = bufptr;
  228.     register char *d;
  229.     register int tmp;
  230.     static bool in_format = FALSE;
  231.     static bool firstline = TRUE;
  232.     extern int yychar;        /* last token */
  233.  
  234.     oldoldbufptr = oldbufptr;
  235.     oldbufptr = s;
  236.  
  237.   retry:
  238. #ifdef YYDEBUG
  239.     if (debug & 1)
  240.     if (index(s,'\n'))
  241.         fprintf(stderr,"Tokener at %s",s);
  242.     else
  243.         fprintf(stderr,"Tokener at %s\n",s);
  244. #endif
  245. #ifdef BADSWITCH
  246.     if (*s & 128) {
  247.     if ((*s & 127) == '(') {
  248.         *s++ = '(';
  249.         oldbufptr = s;
  250.     }
  251.     else if ((*s & 127) == '}') {
  252.         *s++ = '}';
  253.         RETURN('}');
  254.     }
  255.     else
  256.         warn("Unrecognized character \\%03o ignored", *s++ & 255);
  257.     goto retry;
  258.     }
  259. #endif
  260.     switch (*s) {
  261.     default:
  262.     if ((*s & 127) == '(') {
  263.         *s++ = '(';
  264.         oldbufptr = s;
  265.     }
  266.     else if ((*s & 127) == '}') {
  267.         *s++ = '}';
  268.         RETURN('}');
  269.     }
  270.     else
  271.         warn("Unrecognized character \\%03o ignored", *s++ & 255);
  272.     goto retry;
  273.     case 4:
  274.     case 26:
  275.     goto fake_eof;            /* emulate EOF on ^D or ^Z */
  276.     case 0:
  277.     if (!rsfp)
  278.         RETURN(0);
  279.     if (s++ < bufend)
  280.         goto retry;            /* ignore stray nulls */
  281.     last_uni = 0;
  282.     if (firstline) {
  283.         firstline = FALSE;
  284.         if (minus_n || minus_p || perldb) {
  285.         str_set(linestr,"");
  286.         if (perldb) {
  287.             char *getenv();
  288.             char *pdb = getenv("PERLDB");
  289.  
  290.             str_cat(linestr, pdb ? pdb : "require 'perldb.pl'");
  291.             str_cat(linestr, ";");
  292.         }
  293.         if (minus_n || minus_p) {
  294.             str_cat(linestr,"line: while (<>) {");
  295.             if (minus_l)
  296.             str_cat(linestr,"chop;");
  297.             if (minus_a)
  298.             str_cat(linestr,"@F=split(' ');");
  299.         }
  300.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  301.         bufend = linestr->str_ptr + linestr->str_cur;
  302.         goto retry;
  303.         }
  304.     }
  305.     if (in_format) {
  306.         bufptr = bufend;
  307.         yylval.formval = load_format();
  308.         in_format = FALSE;
  309.         oldoldbufptr = oldbufptr = s = str_get(linestr) + 1;
  310.         bufend = linestr->str_ptr + linestr->str_cur;
  311.         OPERATOR(FORMLIST);
  312.     }
  313.     curcmd->c_line++;
  314. #ifdef CRYPTSCRIPT
  315.     cryptswitch();
  316. #endif /* CRYPTSCRIPT */
  317.     do {
  318.         if ((s = str_gets(linestr, rsfp, 0)) == Nullch) {
  319.           fake_eof:
  320.         if (rsfp) {
  321.             if (preprocess)
  322.             (void)mypclose(rsfp);
  323.             else if ((FILE*)rsfp == stdin)
  324.             clearerr(stdin);
  325.             else
  326.             (void)fclose(rsfp);
  327.             rsfp = Nullfp;
  328.         }
  329.         if (minus_n || minus_p) {
  330.             str_set(linestr,minus_p ? ";}continue{print" : "");
  331.             str_cat(linestr,";}");
  332.             oldoldbufptr = oldbufptr = s = str_get(linestr);
  333.             bufend = linestr->str_ptr + linestr->str_cur;
  334.             minus_n = minus_p = 0;
  335.             goto retry;
  336.         }
  337.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  338.         str_set(linestr,"");
  339.         RETURN(';');    /* not infinite loop because rsfp is NULL now */
  340.         }
  341.         if (doextract && *linestr->str_ptr == '#')
  342.         doextract = FALSE;
  343.     } while (doextract);
  344.     oldoldbufptr = oldbufptr = bufptr = s;
  345.     if (perldb) {
  346.         STR *str = Str_new(85,0);
  347.  
  348.         str_sset(str,linestr);
  349.         astore(stab_xarray(curcmd->c_filestab),(int)curcmd->c_line,str);
  350.     }
  351. #ifdef DEBUG
  352.     if (firstline) {
  353.         char *showinput();
  354.         s = showinput();
  355.     }
  356. #endif
  357.     bufend = linestr->str_ptr + linestr->str_cur;
  358.     if (curcmd->c_line == 1) {
  359.         if (*s == '#' && s[1] == '!') {
  360.         if (!in_eval && !instr(s,"perl") && instr(origargv[0],"perl")) {
  361.             char **newargv;
  362.             char *cmd;
  363.  
  364.             s += 2;
  365.             if (*s == ' ')
  366.             s++;
  367.             cmd = s;
  368.             while (s < bufend && !isSPACE(*s))
  369.             s++;
  370.             *s++ = '\0';
  371.             while (s < bufend && isSPACE(*s))
  372.             s++;
  373.             if (s < bufend) {
  374.             Newz(899,newargv,origargc+3,char*);
  375.             newargv[1] = s;
  376.             while (s < bufend && !isSPACE(*s))
  377.                 s++;
  378.             *s = '\0';
  379.             Copy(origargv+1, newargv+2, origargc+1, char*);
  380.             }
  381.             else
  382.             newargv = origargv;
  383.             newargv[0] = cmd;
  384. #ifndef DJGPP
  385.             execv(cmd,newargv);
  386. #endif /* !DJGPP */
  387.             fatal("Can't exec %s", cmd);
  388.         }
  389.         }
  390.         else {
  391.         while (s < bufend && isSPACE(*s))
  392.             s++;
  393.         if (*s == ':')    /* for csh's that have to exec sh scripts */
  394.             s++;
  395.         }
  396.     }
  397.     goto retry;
  398.     case ' ': case '\t': case '\f': case '\r': case 013:
  399.     s++;
  400.     goto retry;
  401.     case '#':
  402.     if (preprocess && s == str_get(linestr) &&
  403.            s[1] == ' ' && (isDIGIT(s[2]) || strnEQ(s+2,"line ",5)) ) {
  404.         while (*s && !isDIGIT(*s))
  405.         s++;
  406.         curcmd->c_line = atoi(s)-1;
  407.         while (isDIGIT(*s))
  408.         s++;
  409.         d = bufend;
  410.         while (s < d && isSPACE(*s)) s++;
  411.         s[strlen(s)-1] = '\0';    /* wipe out newline */
  412.         if (*s == '"') {
  413.         s++;
  414.         s[strlen(s)-1] = '\0';    /* wipe out trailing quote */
  415.         }
  416.         if (*s)
  417.         curcmd->c_filestab = fstab(s);
  418.         else
  419.         curcmd->c_filestab = fstab(origfilename);
  420.         oldoldbufptr = oldbufptr = s = str_get(linestr);
  421.     }
  422.     /* FALL THROUGH */
  423.     case '\n':
  424.     if (in_eval && !rsfp) {
  425.         d = bufend;
  426.         while (s < d && *s != '\n')
  427.         s++;
  428.         if (s < d)
  429.         s++;
  430.         if (in_format) {
  431.         bufptr = s;
  432.         yylval.formval = load_format();
  433.         in_format = FALSE;
  434.         oldoldbufptr = oldbufptr = s = bufptr + 1;
  435.         TERM(FORMLIST);
  436.         }
  437.         curcmd->c_line++;
  438.     }
  439.     else {
  440.         *s = '\0';
  441.         bufend = s;
  442.     }
  443.     goto retry;
  444.     case '-':
  445.     if (s[1] && isALPHA(s[1]) && !isALPHA(s[2])) {
  446.         s++;
  447.         switch (*s++) {
  448.         case 'r': FTST(O_FTEREAD);
  449.         case 'w': FTST(O_FTEWRITE);
  450.         case 'x': FTST(O_FTEEXEC);
  451.         case 'o': FTST(O_FTEOWNED);
  452.         case 'R': FTST(O_FTRREAD);
  453.         case 'W': FTST(O_FTRWRITE);
  454.         case 'X': FTST(O_FTREXEC);
  455.         case 'O': FTST(O_FTROWNED);
  456.         case 'e': FTST(O_FTIS);
  457.         case 'z': FTST(O_FTZERO);
  458.         case 's': FTST(O_FTSIZE);
  459.         case 'f': FTST(O_FTFILE);
  460.         case 'd': FTST(O_FTDIR);
  461.         case 'l': FTST(O_FTLINK);
  462.         case 'p': FTST(O_FTPIPE);
  463.         case 'S': FTST(O_FTSOCK);
  464.         case 'u': FTST(O_FTSUID);
  465.         case 'g': FTST(O_FTSGID);
  466.         case 'k': FTST(O_FTSVTX);
  467.         case 'b': FTST(O_FTBLK);
  468.         case 'c': FTST(O_FTCHR);
  469.         case 't': FTST(O_FTTTY);
  470.         case 'T': FTST(O_FTTEXT);
  471.         case 'B': FTST(O_FTBINARY);
  472.         case 'M': stabent("\024",TRUE); FTST(O_FTMTIME);
  473.         case 'A': stabent("\024",TRUE); FTST(O_FTATIME);
  474.         case 'C': stabent("\024",TRUE); FTST(O_FTCTIME);
  475.         default:
  476.         s -= 2;
  477.         break;
  478.         }
  479.     }
  480.     tmp = *s++;
  481.     if (*s == tmp) {
  482.         s++;
  483.         RETURN(DEC);
  484.     }
  485.     if (expectterm) {
  486.         if (isSPACE(*s) || !isSPACE(*bufptr))
  487.         check_uni();
  488.         OPERATOR('-');
  489.     }
  490.     else
  491.         AOP(O_SUBTRACT);
  492.     case '+':
  493.     tmp = *s++;
  494.     if (*s == tmp) {
  495.         s++;
  496.         RETURN(INC);
  497.     }
  498.     if (expectterm) {
  499.         if (isSPACE(*s) || !isSPACE(*bufptr))
  500.         check_uni();
  501.         OPERATOR('+');
  502.     }
  503.     else
  504.         AOP(O_ADD);
  505.  
  506.     case '*':
  507.     if (expectterm) {
  508.         check_uni();
  509.         s = scanident(s,bufend,tokenbuf);
  510.         yylval.stabval = stabent(tokenbuf,TRUE);
  511.         TERM(STAR);
  512.     }
  513.     tmp = *s++;
  514.     if (*s == tmp) {
  515.         s++;
  516.         OPERATOR(POW);
  517.     }
  518.     MOP(O_MULTIPLY);
  519.     case '%':
  520.     if (expectterm) {
  521.         if (!isALPHA(s[1]))
  522.         check_uni();
  523.         s = scanident(s,bufend,tokenbuf);
  524.         yylval.stabval = hadd(stabent(tokenbuf,TRUE));
  525.         TERM(HSH);
  526.     }
  527.     s++;
  528.     MOP(O_MODULO);
  529.  
  530.     case '^':
  531.     case '~':
  532.     case '(':
  533.     case ',':
  534.     case ':':
  535.     case '[':
  536.     tmp = *s++;
  537.     OPERATOR(tmp);
  538.     case '{':
  539.     tmp = *s++;
  540.     yylval.ival = curcmd->c_line;
  541.     if (isSPACE(*s) || *s == '#')
  542.         cmdline = NOLINE;   /* invalidate current command line number */
  543.     expectterm = 2;
  544.     RETURN(tmp);
  545.     case ';':
  546.     if (curcmd->c_line < cmdline)
  547.         cmdline = curcmd->c_line;
  548.     tmp = *s++;
  549.     OPERATOR(tmp);
  550.     case ')':
  551.     case ']':
  552.     tmp = *s++;
  553.     TERM(tmp);
  554.     case '}':
  555.     *s |= 128;
  556.     RETURN(';');
  557.     case '&':
  558.     s++;
  559.     tmp = *s++;
  560.     if (tmp == '&')
  561.         OPERATOR(ANDAND);
  562.     s--;
  563.     if (expectterm) {
  564.         d = bufend;
  565.         while (s < d && isSPACE(*s))
  566.         s++;
  567.         if (isALPHA(*s) || *s == '_' || *s == '\'')
  568.         *(--s) = '\\';    /* force next ident to WORD */
  569.         else
  570.         check_uni();
  571.         OPERATOR(AMPER);
  572.     }
  573.     OPERATOR('&');
  574.     case '|':
  575.     s++;
  576.     tmp = *s++;
  577.     if (tmp == '|')
  578.         OPERATOR(OROR);
  579.     s--;
  580.     OPERATOR('|');
  581.     case '=':
  582.     s++;
  583.     tmp = *s++;
  584.     if (tmp == '=')
  585.         EOP(O_EQ);
  586.     if (tmp == '~')
  587.         OPERATOR(MATCH);
  588.     s--;
  589.     OPERATOR('=');
  590.     case '!':
  591.     s++;
  592.     tmp = *s++;
  593.     if (tmp == '=')
  594.         EOP(O_NE);
  595.     if (tmp == '~')
  596.         OPERATOR(NMATCH);
  597.     s--;
  598.     OPERATOR('!');
  599.     case '<':
  600.     if (expectterm) {
  601.         if (s[1] != '<' && !index(s,'>'))
  602.         check_uni();
  603.         s = scanstr(s, SCAN_DEF);
  604.         TERM(RSTRING);
  605.     }
  606.     s++;
  607.     tmp = *s++;
  608.     if (tmp == '<')
  609.         OPERATOR(LS);
  610.     if (tmp == '=') {
  611.         tmp = *s++;
  612.         if (tmp == '>')
  613.         EOP(O_NCMP);
  614.         s--;
  615.         ROP(O_LE);
  616.     }
  617.     s--;
  618.     ROP(O_LT);
  619.     case '>':
  620.     s++;
  621.     tmp = *s++;
  622.     if (tmp == '>')
  623.         OPERATOR(RS);
  624.     if (tmp == '=')
  625.         ROP(O_GE);
  626.     s--;
  627.     ROP(O_GT);
  628.  
  629. #define SNARFWORD \
  630.     d = tokenbuf; \
  631.     while (isALNUM(*s) || *s == '\'') \
  632.         *d++ = *s++; \
  633.     while (d[-1] == '\'') \
  634.         d--,s--; \
  635.     *d = '\0'; \
  636.     d = tokenbuf;
  637.  
  638.     case '$':
  639.     if (s[1] == '#' && (isALPHA(s[2]) || s[2] == '_')) {
  640.         s++;
  641.         s = scanident(s,bufend,tokenbuf);
  642.         yylval.stabval = aadd(stabent(tokenbuf,TRUE));
  643.         TERM(ARYLEN);
  644.     }
  645.     d = s;
  646.     s = scanident(s,bufend,tokenbuf);
  647.     if (reparse) {        /* turn ${foo[bar]} into ($foo[bar]) */
  648.       do_reparse:
  649.         s[-1] = ')';
  650.         s = d;
  651.         s[1] = s[0];
  652.         s[0] = '(';
  653.         goto retry;
  654.     }
  655.     yylval.stabval = stabent(tokenbuf,TRUE);
  656.     expectterm = FALSE;
  657.     if (isSPACE(*s) && oldoldbufptr && oldoldbufptr < bufptr) {
  658.         s++;
  659.         while (isSPACE(*oldoldbufptr))
  660.         oldoldbufptr++;
  661.         if (*oldoldbufptr == 'p' && strnEQ(oldoldbufptr,"print",5)) {
  662.         if (index("&*<%", *s) && isALPHA(s[1]))
  663.             expectterm = TRUE;        /* e.g. print $fh &sub */
  664.         else if (*s == '.' && isDIGIT(s[1]))
  665.             expectterm = TRUE;        /* e.g. print $fh .3 */
  666.         else if (index("/?-+", *s) && !isSPACE(s[1]))
  667.             expectterm = TRUE;        /* e.g. print $fh -1 */
  668.         }
  669.     }
  670.     RETURN(REG);
  671.  
  672.     case '@':
  673.     d = s;
  674.     s = scanident(s,bufend,tokenbuf);
  675.     if (reparse)
  676.         goto do_reparse;
  677.     yylval.stabval = aadd(stabent(tokenbuf,TRUE));
  678.     TERM(ARY);
  679.  
  680.     case '/':            /* may either be division or pattern */
  681.     case '?':            /* may either be conditional or pattern */
  682.     if (expectterm) {
  683.         check_uni();
  684.         s = scanpat(s);
  685.         TERM(PATTERN);
  686.     }
  687.     tmp = *s++;
  688.     if (tmp == '/')
  689.         MOP(O_DIVIDE);
  690.     OPERATOR(tmp);
  691.  
  692.     case '.':
  693.     if (!expectterm || !isDIGIT(s[1])) {
  694.         tmp = *s++;
  695.         if (*s == tmp) {
  696.         s++;
  697.         if (*s == tmp) {
  698.             s++;
  699.             yylval.ival = 0;
  700.         }
  701.         else
  702.             yylval.ival = AF_COMMON;
  703.         OPERATOR(DOTDOT);
  704.         }
  705.         if (expectterm)
  706.         check_uni();
  707.         AOP(O_CONCAT);
  708.     }
  709.     /* FALL THROUGH */
  710.     case '0': case '1': case '2': case '3': case '4':
  711.     case '5': case '6': case '7': case '8': case '9':
  712.     case '\'': case '"': case '`':
  713.     s = scanstr(s, SCAN_DEF);
  714.     TERM(RSTRING);
  715.  
  716.     case '\\':    /* some magic to force next word to be a WORD */
  717.     s++;    /* used by do and sub to force a separate namespace */
  718.     if (!isALPHA(*s) && *s != '_' && *s != '\'') {
  719.         warn("Spurious backslash ignored");
  720.         goto retry;
  721.     }
  722.     /* FALL THROUGH */
  723.     case '_':
  724.     SNARFWORD;
  725.     if (d[1] == '_') {
  726.         if (strEQ(d,"__LINE__") || strEQ(d,"__FILE__")) {
  727.         ARG *arg = op_new(1);
  728.  
  729.         yylval.arg = arg;
  730.         arg->arg_type = O_ITEM;
  731.         if (d[2] == 'L')
  732.             (void)sprintf(tokenbuf,"%ld",(long)curcmd->c_line);
  733.         else
  734.             strcpy(tokenbuf, stab_val(curcmd->c_filestab)->str_ptr);
  735.         arg[1].arg_type = A_SINGLE;
  736.         arg[1].arg_ptr.arg_str = str_make(tokenbuf,strlen(tokenbuf));
  737.         TERM(RSTRING);
  738.         }
  739.         else if (strEQ(d,"__END__")) {
  740.         STAB *stab;
  741.         int fd;
  742.  
  743.         /*SUPPRESS 560*/
  744.         if (!in_eval && (stab = stabent("DATA",FALSE))) {
  745.             stab->str_pok |= SP_MULTI;
  746.             if (!stab_io(stab))
  747.             stab_io(stab) = stio_new();
  748.             stab_io(stab)->ifp = rsfp;
  749. #if defined(HAS_FCNTL) && defined(F_SETFD)
  750.             fd = fileno(rsfp);
  751.             fcntl(fd,F_SETFD,fd >= 3);
  752. #endif
  753.             if (preprocess)
  754.             stab_io(stab)->type = '|';
  755.             else if ((FILE*)rsfp == stdin)
  756.             stab_io(stab)->type = '-';
  757.             else
  758.             stab_io(stab)->type = '<';
  759.             rsfp = Nullfp;
  760.         }
  761.         goto fake_eof;
  762.         }
  763.     }
  764.     break;
  765.     case 'a': case 'A':
  766.     SNARFWORD;
  767.     if (strEQ(d,"alarm"))
  768.         UNI(O_ALARM);
  769.     if (strEQ(d,"accept"))
  770.         FOP22(O_ACCEPT);
  771.     if (strEQ(d,"atan2"))
  772.         FUN2(O_ATAN2);
  773.     break;
  774.     case 'b': case 'B':
  775.     SNARFWORD;
  776.     if (strEQ(d,"bind"))
  777.         FOP2(O_BIND);
  778.     if (strEQ(d,"binmode"))
  779.         FOP(O_BINMODE);
  780.     break;
  781.     case 'c': case 'C':
  782.     SNARFWORD;
  783.     if (strEQ(d,"chop"))
  784.         LFUN(O_CHOP);
  785.     if (strEQ(d,"continue"))
  786.         OPERATOR(CONTINUE);
  787.     if (strEQ(d,"chdir")) {
  788.         (void)stabent("ENV",TRUE);    /* may use HOME */
  789.         UNI(O_CHDIR);
  790.     }
  791.     if (strEQ(d,"close"))
  792.         FOP(O_CLOSE);
  793.     if (strEQ(d,"closedir"))
  794.         FOP(O_CLOSEDIR);
  795.     if (strEQ(d,"cmp"))
  796.         EOP(O_SCMP);
  797.     if (strEQ(d,"caller"))
  798.         UNI(O_CALLER);
  799.     if (strEQ(d,"crypt")) {
  800. #ifdef FCRYPT
  801.         static int cryptseen = 0;
  802.  
  803.         if (!cryptseen++)
  804.         init_des();
  805. #endif
  806.         FUN2(O_CRYPT);
  807.     }
  808.     if (strEQ(d,"chmod"))
  809.         LOP(O_CHMOD);
  810.     if (strEQ(d,"chown"))
  811.         LOP(O_CHOWN);
  812.     if (strEQ(d,"connect"))
  813.         FOP2(O_CONNECT);
  814.     if (strEQ(d,"cos"))
  815.         UNI(O_COS);
  816.     if (strEQ(d,"chroot"))
  817.         UNI(O_CHROOT);
  818.     break;
  819.     case 'd': case 'D':
  820.     SNARFWORD;
  821.     if (strEQ(d,"do")) {
  822.         d = bufend;
  823.         while (s < d && isSPACE(*s))
  824.         s++;
  825.         if (isALPHA(*s) || *s == '_')
  826.         *(--s) = '\\';    /* force next ident to WORD */
  827.         OPERATOR(DO);
  828.     }
  829.     if (strEQ(d,"die"))
  830.         LOP(O_DIE);
  831.     if (strEQ(d,"defined"))
  832.         LFUN(O_DEFINED);
  833.     if (strEQ(d,"delete"))
  834.         OPERATOR(DELETE);
  835.     if (strEQ(d,"dbmopen"))
  836.         HFUN3(O_DBMOPEN);
  837.     if (strEQ(d,"dbmclose"))
  838.         HFUN(O_DBMCLOSE);
  839.     if (strEQ(d,"dump"))
  840.         LOOPX(O_DUMP);
  841.     break;
  842.     case 'e': case 'E':
  843.     SNARFWORD;
  844.     if (strEQ(d,"else"))
  845.         OPERATOR(ELSE);
  846.     if (strEQ(d,"elsif")) {
  847.         yylval.ival = curcmd->c_line;
  848.         OPERATOR(ELSIF);
  849.     }
  850.     if (strEQ(d,"eq") || strEQ(d,"EQ"))
  851.         EOP(O_SEQ);
  852.     if (strEQ(d,"exit"))
  853.         UNI(O_EXIT);
  854.     if (strEQ(d,"eval")) {
  855.         allstabs = TRUE;        /* must initialize everything since */
  856.         UNI(O_EVAL);        /* we don't know what will be used */
  857.     }
  858.     if (strEQ(d,"eof"))
  859.         FOP(O_EOF);
  860.     if (strEQ(d,"exp"))
  861.         UNI(O_EXP);
  862.     if (strEQ(d,"each"))
  863.         HFUN(O_EACH);
  864.     if (strEQ(d,"exec")) {
  865.         set_csh();
  866.         LOP(O_EXEC_OP);
  867.     }
  868.     if (strEQ(d,"endhostent"))
  869.         FUN0(O_EHOSTENT);
  870.     if (strEQ(d,"endnetent"))
  871.         FUN0(O_ENETENT);
  872.     if (strEQ(d,"endservent"))
  873.         FUN0(O_ESERVENT);
  874.     if (strEQ(d,"endprotoent"))
  875.         FUN0(O_EPROTOENT);
  876.     if (strEQ(d,"endpwent"))
  877.         FUN0(O_EPWENT);
  878.     if (strEQ(d,"endgrent"))
  879.         FUN0(O_EGRENT);
  880.     break;
  881.     case 'f': case 'F':
  882.     SNARFWORD;
  883.     if (strEQ(d,"for") || strEQ(d,"foreach")) {
  884.         yylval.ival = curcmd->c_line;
  885.         while (s < bufend && isSPACE(*s))
  886.         s++;
  887.         if (isALPHA(*s))
  888.         fatal("Missing $ on loop variable");
  889.         OPERATOR(FOR);
  890.     }
  891.     if (strEQ(d,"format")) {
  892.         d = bufend;
  893.         while (s < d && isSPACE(*s))
  894.         s++;
  895.         if (isALPHA(*s) || *s == '_')
  896.         *(--s) = '\\';    /* force next ident to WORD */
  897.         in_format = TRUE;
  898.         allstabs = TRUE;        /* must initialize everything since */
  899.         OPERATOR(FORMAT);        /* we don't know what will be used */
  900.     }
  901.     if (strEQ(d,"fork"))
  902.         FUN0(O_FORK);
  903.     if (strEQ(d,"fcntl"))
  904.         FOP3(O_FCNTL);
  905.     if (strEQ(d,"fileno"))
  906.         FOP(O_FILENO);
  907.     if (strEQ(d,"flock"))
  908.         FOP2(O_FLOCK);
  909.     break;
  910.     case 'g': case 'G':
  911.     SNARFWORD;
  912.     if (strEQ(d,"gt") || strEQ(d,"GT"))
  913.         ROP(O_SGT);
  914.     if (strEQ(d,"ge") || strEQ(d,"GE"))
  915.         ROP(O_SGE);
  916.     if (strEQ(d,"grep"))
  917.         FL2(O_GREP);
  918.     if (strEQ(d,"goto"))
  919.         LOOPX(O_GOTO);
  920.     if (strEQ(d,"gmtime"))
  921.         UNI(O_GMTIME);
  922.     if (strEQ(d,"getc"))
  923.         FOP(O_GETC);
  924.     if (strnEQ(d,"get",3)) {
  925.         d += 3;
  926.         if (*d == 'p') {
  927.         if (strEQ(d,"ppid"))
  928.             FUN0(O_GETPPID);
  929.         if (strEQ(d,"pgrp"))
  930.             UNI(O_GETPGRP);
  931.         if (strEQ(d,"priority"))
  932.             FUN2(O_GETPRIORITY);
  933.         if (strEQ(d,"protobyname"))
  934.             UNI(O_GPBYNAME);
  935.         if (strEQ(d,"protobynumber"))
  936.             FUN1(O_GPBYNUMBER);
  937.         if (strEQ(d,"protoent"))
  938.             FUN0(O_GPROTOENT);
  939.         if (strEQ(d,"pwent"))
  940.             FUN0(O_GPWENT);
  941.         if (strEQ(d,"pwnam"))
  942.             FUN1(O_GPWNAM);
  943.         if (strEQ(d,"pwuid"))
  944.             FUN1(O_GPWUID);
  945.         if (strEQ(d,"peername"))
  946.             FOP(O_GETPEERNAME);
  947.         }
  948.         else if (*d == 'h') {
  949.         if (strEQ(d,"hostbyname"))
  950.             UNI(O_GHBYNAME);
  951.         if (strEQ(d,"hostbyaddr"))
  952.             FUN2(O_GHBYADDR);
  953.         if (strEQ(d,"hostent"))
  954.             FUN0(O_GHOSTENT);
  955.         }
  956.         else if (*d == 'n') {
  957.         if (strEQ(d,"netbyname"))
  958.             UNI(O_GNBYNAME);
  959.         if (strEQ(d,"netbyaddr"))
  960.             FUN2(O_GNBYADDR);
  961.         if (strEQ(d,"netent"))
  962.             FUN0(O_GNETENT);
  963.         }
  964.         else if (*d == 's') {
  965.         if (strEQ(d,"servbyname"))
  966.             FUN2(O_GSBYNAME);
  967.         if (strEQ(d,"servbyport"))
  968.             FUN2(O_GSBYPORT);
  969.         if (strEQ(d,"servent"))
  970.             FUN0(O_GSERVENT);
  971.         if (strEQ(d,"sockname"))
  972.             FOP(O_GETSOCKNAME);
  973.         if (strEQ(d,"sockopt"))
  974.             FOP3(O_GSOCKOPT);
  975.         }
  976.         else if (*d == 'g') {
  977.         if (strEQ(d,"grent"))
  978.             FUN0(O_GGRENT);
  979.         if (strEQ(d,"grnam"))
  980.             FUN1(O_GGRNAM);
  981.         if (strEQ(d,"grgid"))
  982.             FUN1(O_GGRGID);
  983.         }
  984.         else if (*d == 'l') {
  985.         if (strEQ(d,"login"))
  986.             FUN0(O_GETLOGIN);
  987.         }
  988.         d -= 3;
  989.     }
  990.     break;
  991.     case 'h': case 'H':
  992.     SNARFWORD;
  993.     if (strEQ(d,"hex"))
  994.         UNI(O_HEX);
  995.     break;
  996.     case 'i': case 'I':
  997.     SNARFWORD;
  998.     if (strEQ(d,"if")) {
  999.         yylval.ival = curcmd->c_line;
  1000.         OPERATOR(IF);
  1001.     }
  1002.     if (strEQ(d,"index"))
  1003.         FUN2x(O_INDEX);
  1004.     if (strEQ(d,"int"))
  1005.         UNI(O_INT);
  1006.     if (strEQ(d,"ioctl"))
  1007.         FOP3(O_IOCTL);
  1008.     break;
  1009.     case 'j': case 'J':
  1010.     SNARFWORD;
  1011.     if (strEQ(d,"join"))
  1012.         FL2(O_JOIN);
  1013.     break;
  1014.     case 'k': case 'K':
  1015.     SNARFWORD;
  1016.     if (strEQ(d,"keys"))
  1017.         HFUN(O_KEYS);
  1018.     if (strEQ(d,"kill"))
  1019.         LOP(O_KILL);
  1020.     break;
  1021.     case 'l': case 'L':
  1022.     SNARFWORD;
  1023.     if (strEQ(d,"last"))
  1024.         LOOPX(O_LAST);
  1025.     if (strEQ(d,"local"))
  1026.         OPERATOR(LOCAL);
  1027.     if (strEQ(d,"length"))
  1028.         UNI(O_LENGTH);
  1029.     if (strEQ(d,"lt") || strEQ(d,"LT"))
  1030.         ROP(O_SLT);
  1031.     if (strEQ(d,"le") || strEQ(d,"LE"))
  1032.         ROP(O_SLE);
  1033.     if (strEQ(d,"localtime"))
  1034.         UNI(O_LOCALTIME);
  1035.     if (strEQ(d,"log"))
  1036.         UNI(O_LOG);
  1037.     if (strEQ(d,"link"))
  1038.         FUN2(O_LINK);
  1039.     if (strEQ(d,"listen"))
  1040.         FOP2(O_LISTEN);
  1041.     if (strEQ(d,"lstat"))
  1042.         FOP(O_LSTAT);
  1043.     break;
  1044.     case 'm': case 'M':
  1045.     if (s[1] == '\'') {
  1046.         d = "m";
  1047.         s++;
  1048.     }
  1049.     else {
  1050.         SNARFWORD;
  1051.     }
  1052.     if (strEQ(d,"m")) {
  1053.         s = scanpat(s-1);
  1054.         if (yylval.arg)
  1055.         TERM(PATTERN);
  1056.         else
  1057.         RETURN(1);    /* force error */
  1058.     }
  1059.     switch (d[1]) {
  1060.     case 'k':
  1061.         if (strEQ(d,"mkdir"))
  1062.         FUN2(O_MKDIR);
  1063.         break;
  1064.     case 's':
  1065.         if (strEQ(d,"msgctl"))
  1066.         FUN3(O_MSGCTL);
  1067.         if (strEQ(d,"msgget"))
  1068.         FUN2(O_MSGGET);
  1069.         if (strEQ(d,"msgrcv"))
  1070.         FUN5(O_MSGRCV);
  1071.         if (strEQ(d,"msgsnd"))
  1072.         FUN3(O_MSGSND);
  1073.         break;
  1074.     }
  1075.     break;
  1076.     case 'n': case 'N':
  1077.     SNARFWORD;
  1078.     if (strEQ(d,"next"))
  1079.         LOOPX(O_NEXT);
  1080.     if (strEQ(d,"ne") || strEQ(d,"NE"))
  1081.         EOP(O_SNE);
  1082.     break;
  1083.     case 'o': case 'O':
  1084.     SNARFWORD;
  1085.     if (strEQ(d,"open"))
  1086.         OPERATOR(OPEN);
  1087.     if (strEQ(d,"ord"))
  1088.         UNI(O_ORD);
  1089.     if (strEQ(d,"oct"))
  1090.         UNI(O_OCT);
  1091.     if (strEQ(d,"opendir"))
  1092.         FOP2(O_OPEN_DIR);
  1093.     break;
  1094.     case 'p': case 'P':
  1095.     SNARFWORD;
  1096.     if (strEQ(d,"print")) {
  1097.         checkcomma(s,d,"filehandle");
  1098.         LOP(O_PRINT);
  1099.     }
  1100.     if (strEQ(d,"printf")) {
  1101.         checkcomma(s,d,"filehandle");
  1102.         LOP(O_PRTF);
  1103.     }
  1104.     if (strEQ(d,"push")) {
  1105.         yylval.ival = O_PUSH;
  1106.         OPERATOR(PUSH);
  1107.     }
  1108.     if (strEQ(d,"pop"))
  1109.         OPERATOR(POP);
  1110.     if (strEQ(d,"pack"))
  1111.         FL2(O_PACK);
  1112.     if (strEQ(d,"package"))
  1113.         OPERATOR(PACKAGE);
  1114.     if (strEQ(d,"pipe"))
  1115.         FOP22(O_PIPE_OP);
  1116.     break;
  1117.     case 'q': case 'Q':
  1118.     SNARFWORD;
  1119.     if (strEQ(d,"q")) {
  1120.         s = scanstr(s-1, SCAN_DEF);
  1121.         TERM(RSTRING);
  1122.     }
  1123.     if (strEQ(d,"qq")) {
  1124.         s = scanstr(s-2, SCAN_DEF);
  1125.         TERM(RSTRING);
  1126.     }
  1127.     if (strEQ(d,"qx")) {
  1128.         s = scanstr(s-2, SCAN_DEF);
  1129.         TERM(RSTRING);
  1130.     }
  1131.     break;
  1132.     case 'r': case 'R':
  1133.     SNARFWORD;
  1134.     if (strEQ(d,"return"))
  1135.         OLDLOP(O_RETURN);
  1136.     if (strEQ(d,"require")) {
  1137.         allstabs = TRUE;        /* must initialize everything since */
  1138.         UNI(O_REQUIRE);        /* we don't know what will be used */
  1139.     }
  1140.     if (strEQ(d,"reset"))
  1141.         UNI(O_RESET);
  1142.     if (strEQ(d,"redo"))
  1143.         LOOPX(O_REDO);
  1144.     if (strEQ(d,"rename"))
  1145.         FUN2(O_RENAME);
  1146.     if (strEQ(d,"rand"))
  1147.         UNI(O_RAND);
  1148.     if (strEQ(d,"rmdir"))
  1149.         UNI(O_RMDIR);
  1150.     if (strEQ(d,"rindex"))
  1151.         FUN2x(O_RINDEX);
  1152.     if (strEQ(d,"read"))
  1153.         FOP3(O_READ);
  1154.     if (strEQ(d,"readdir"))
  1155.         FOP(O_READDIR);
  1156.     if (strEQ(d,"rewinddir"))
  1157.         FOP(O_REWINDDIR);
  1158.     if (strEQ(d,"recv"))
  1159.         FOP4(O_RECV);
  1160.     if (strEQ(d,"reverse"))
  1161.         LOP(O_REVERSE);
  1162.     if (strEQ(d,"readlink"))
  1163.         UNI(O_READLINK);
  1164.     break;
  1165.     case 's': case 'S':
  1166.     if (s[1] == '\'') {
  1167.         d = "s";
  1168.         s++;
  1169.     }
  1170.     else {
  1171.         SNARFWORD;
  1172.     }
  1173.     if (strEQ(d,"s")) {
  1174.         s = scansubst(s);
  1175.         if (yylval.arg)
  1176.         TERM(SUBST);
  1177.         else
  1178.         RETURN(1);    /* force error */
  1179.     }
  1180.     switch (d[1]) {
  1181.     case 'a':
  1182.     case 'b':
  1183.         break;
  1184.     case 'c':
  1185.         if (strEQ(d,"scalar"))
  1186.         UNI(O_SCALAR);
  1187.         break;
  1188.     case 'd':
  1189.         break;
  1190.     case 'e':
  1191.         if (strEQ(d,"select"))
  1192.         OPERATOR(SSELECT);
  1193.         if (strEQ(d,"seek"))
  1194.         FOP3(O_SEEK);
  1195.         if (strEQ(d,"semctl"))
  1196.         FUN4(O_SEMCTL);
  1197.         if (strEQ(d,"semget"))
  1198.         FUN3(O_SEMGET);
  1199.         if (strEQ(d,"semop"))
  1200.         FUN2(O_SEMOP);
  1201.         if (strEQ(d,"send"))
  1202.         FOP3(O_SEND);
  1203.         if (strEQ(d,"setpgrp"))
  1204.         FUN2(O_SETPGRP);
  1205.         if (strEQ(d,"setpriority"))
  1206.         FUN3(O_SETPRIORITY);
  1207.         if (strEQ(d,"sethostent"))
  1208.         FUN1(O_SHOSTENT);
  1209.         if (strEQ(d,"setnetent"))
  1210.         FUN1(O_SNETENT);
  1211.         if (strEQ(d,"setservent"))
  1212.         FUN1(O_SSERVENT);
  1213.         if (strEQ(d,"setprotoent"))
  1214.         FUN1(O_SPROTOENT);
  1215.         if (strEQ(d,"setpwent"))
  1216.         FUN0(O_SPWENT);
  1217.         if (strEQ(d,"setgrent"))
  1218.         FUN0(O_SGRENT);
  1219.         if (strEQ(d,"seekdir"))
  1220.         FOP2(O_SEEKDIR);
  1221.         if (strEQ(d,"setsockopt"))
  1222.         FOP4(O_SSOCKOPT);
  1223.         break;
  1224.     case 'f':
  1225.     case 'g':
  1226.         break;
  1227.     case 'h':
  1228.         if (strEQ(d,"shift"))
  1229.         TERM(SHIFT);
  1230.         if (strEQ(d,"shmctl"))
  1231.         FUN3(O_SHMCTL);
  1232.         if (strEQ(d,"shmget"))
  1233.         FUN3(O_SHMGET);
  1234.         if (strEQ(d,"shmread"))
  1235.         FUN4(O_SHMREAD);
  1236.         if (strEQ(d,"shmwrite"))
  1237.         FUN4(O_SHMWRITE);
  1238.         if (strEQ(d,"shutdown"))
  1239.         FOP2(O_SHUTDOWN);
  1240.         break;
  1241.     case 'i':
  1242.         if (strEQ(d,"sin"))
  1243.         UNI(O_SIN);
  1244.         break;
  1245.     case 'j':
  1246.     case 'k':
  1247.         break;
  1248.     case 'l':
  1249.         if (strEQ(d,"sleep"))
  1250.         UNI(O_SLEEP);
  1251.         break;
  1252.     case 'm':
  1253.     case 'n':
  1254.         break;
  1255.     case 'o':
  1256.         if (strEQ(d,"socket"))
  1257.         FOP4(O_SOCKET);
  1258.         if (strEQ(d,"socketpair"))
  1259.         FOP25(O_SOCKPAIR);
  1260.         if (strEQ(d,"sort")) {
  1261.         checkcomma(s,d,"subroutine name");
  1262.         d = bufend;
  1263.         while (s < d && isSPACE(*s)) s++;
  1264.         if (*s == ';' || *s == ')')        /* probably a close */
  1265.             fatal("sort is now a reserved word");
  1266.         if (isALPHA(*s) || *s == '_') {
  1267.             /*SUPPRESS 530*/
  1268.             for (d = s; isALNUM(*d); d++) ;
  1269.             strncpy(tokenbuf,s,d-s);
  1270.             tokenbuf[d-s] = '\0';
  1271.             if (strNE(tokenbuf,"keys") &&
  1272.             strNE(tokenbuf,"values") &&
  1273.             strNE(tokenbuf,"split") &&
  1274.             strNE(tokenbuf,"grep") &&
  1275.             strNE(tokenbuf,"readdir") &&
  1276.             strNE(tokenbuf,"unpack") &&
  1277.             strNE(tokenbuf,"do") &&
  1278.             strNE(tokenbuf,"eval") &&
  1279.             (d >= bufend || isSPACE(*d)) )
  1280.             *(--s) = '\\';    /* force next ident to WORD */
  1281.         }
  1282.         LOP(O_SORT);
  1283.         }
  1284.         break;
  1285.     case 'p':
  1286.         if (strEQ(d,"split"))
  1287.         TERM(SPLIT);
  1288.         if (strEQ(d,"sprintf"))
  1289.         FL(O_SPRINTF);
  1290.         if (strEQ(d,"splice")) {
  1291.         yylval.ival = O_SPLICE;
  1292.         OPERATOR(PUSH);
  1293.         }
  1294.         break;
  1295.     case 'q':
  1296.         if (strEQ(d,"sqrt"))
  1297.         UNI(O_SQRT);
  1298.         break;
  1299.     case 'r':
  1300.         if (strEQ(d,"srand"))
  1301.         UNI(O_SRAND);
  1302.         break;
  1303.     case 's':
  1304.         break;
  1305.     case 't':
  1306.         if (strEQ(d,"stat"))
  1307.         FOP(O_STAT);
  1308.         if (strEQ(d,"study")) {
  1309.         sawstudy++;
  1310.         LFUN(O_STUDY);
  1311.         }
  1312.         break;
  1313.     case 'u':
  1314.         if (strEQ(d,"substr"))
  1315.         FUN2x(O_SUBSTR);
  1316.         if (strEQ(d,"sub")) {
  1317.         yylval.ival = savestack->ary_fill; /* restore stuff on reduce */
  1318.         savelong(&subline);
  1319.         saveitem(subname);
  1320.  
  1321.         subline = curcmd->c_line;
  1322.         d = bufend;
  1323.         while (s < d && isSPACE(*s))
  1324.             s++;
  1325.         if (isALPHA(*s) || *s == '_' || *s == '\'') {
  1326.             str_sset(subname,curstname);
  1327.             str_ncat(subname,"'",1);
  1328.             for (d = s+1; isALNUM(*d) || *d == '\''; d++)
  1329.             /*SUPPRESS 530*/
  1330.             ;
  1331.             if (d[-1] == '\'')
  1332.             d--;
  1333.             str_ncat(subname,s,d-s);
  1334.             *(--s) = '\\';    /* force next ident to WORD */
  1335.         }
  1336.         else
  1337.             str_set(subname,"?");
  1338.         OPERATOR(SUB);
  1339.         }
  1340.         break;
  1341.     case 'v':
  1342.     case 'w':
  1343.     case 'x':
  1344.         break;
  1345.     case 'y':
  1346.         if (strEQ(d,"system")) {
  1347.         set_csh();
  1348.         LOP(O_SYSTEM);
  1349.         }
  1350.         if (strEQ(d,"symlink"))
  1351.         FUN2(O_SYMLINK);
  1352.         if (strEQ(d,"syscall"))
  1353.         LOP(O_SYSCALL);
  1354.         if (strEQ(d,"sysread"))
  1355.         FOP3(O_SYSREAD);
  1356.         if (strEQ(d,"syswrite"))
  1357.         FOP3(O_SYSWRITE);
  1358.         break;
  1359.     case 'z':
  1360.         break;
  1361.     }
  1362.     break;
  1363.     case 't': case 'T':
  1364.     SNARFWORD;
  1365.     if (strEQ(d,"tr")) {
  1366.         s = scantrans(s);
  1367.         if (yylval.arg)
  1368.         TERM(TRANS);
  1369.         else
  1370.         RETURN(1);    /* force error */
  1371.     }
  1372.     if (strEQ(d,"tell"))
  1373.         FOP(O_TELL);
  1374.     if (strEQ(d,"telldir"))
  1375.         FOP(O_TELLDIR);
  1376.     if (strEQ(d,"time"))
  1377.         FUN0(O_TIME);
  1378.     if (strEQ(d,"times"))
  1379.         FUN0(O_TMS);
  1380.     if (strEQ(d,"truncate"))
  1381.         FOP2(O_TRUNCATE);
  1382.     break;
  1383.     case 'u': case 'U':
  1384.     SNARFWORD;
  1385.     if (strEQ(d,"using"))
  1386.         OPERATOR(USING);
  1387.     if (strEQ(d,"until")) {
  1388.         yylval.ival = curcmd->c_line;
  1389.         OPERATOR(UNTIL);
  1390.     }
  1391.     if (strEQ(d,"unless")) {
  1392.         yylval.ival = curcmd->c_line;
  1393.         OPERATOR(UNLESS);
  1394.     }
  1395.     if (strEQ(d,"unlink"))
  1396.         LOP(O_UNLINK);
  1397.     if (strEQ(d,"undef"))
  1398.         LFUN(O_UNDEF);
  1399.     if (strEQ(d,"unpack"))
  1400.         FUN2(O_UNPACK);
  1401.     if (strEQ(d,"utime"))
  1402.         LOP(O_UTIME);
  1403.     if (strEQ(d,"umask"))
  1404.         UNI(O_UMASK);
  1405.     if (strEQ(d,"unshift")) {
  1406.         yylval.ival = O_UNSHIFT;
  1407.         OPERATOR(PUSH);
  1408.     }
  1409.     break;
  1410.     case 'v': case 'V':
  1411.     SNARFWORD;
  1412.     if (strEQ(d,"values"))
  1413.         HFUN(O_VALUES);
  1414.     if (strEQ(d,"vec")) {
  1415.         sawvec = TRUE;
  1416.         FUN3(O_VEC);
  1417.     }
  1418.     break;
  1419.     case 'w': case 'W':
  1420.     SNARFWORD;
  1421.     if (strEQ(d,"while")) {
  1422.         yylval.ival = curcmd->c_line;
  1423.         OPERATOR(WHILE);
  1424.     }
  1425.     if (strEQ(d,"warn"))
  1426.         LOP(O_WARN);
  1427.     if (strEQ(d,"wait"))
  1428.         FUN0(O_WAIT);
  1429.     if (strEQ(d,"waitpid"))
  1430.         FUN2(O_WAITPID);
  1431.     if (strEQ(d,"wantarray")) {
  1432.         yylval.arg = op_new(1);
  1433.         yylval.arg->arg_type = O_ITEM;
  1434.         yylval.arg[1].arg_type = A_WANTARRAY;
  1435.         TERM(RSTRING);
  1436.     }
  1437.     if (strEQ(d,"write"))
  1438.         FOP(O_WRITE);
  1439.     break;
  1440.     case 'x': case 'X':
  1441.     if (*s == 'x' && isDIGIT(s[1]) && !expectterm) {
  1442.         s++;
  1443.         MOP(O_REPEAT);
  1444.     }
  1445.     SNARFWORD;
  1446.     if (strEQ(d,"x")) {
  1447.         if (!expectterm)
  1448.         MOP(O_REPEAT);
  1449.         check_uni();
  1450.     }
  1451.     break;
  1452.     case 'y': case 'Y':
  1453.     if (s[1] == '\'') {
  1454.         d = "y";
  1455.         s++;
  1456.     }
  1457.     else {
  1458.         SNARFWORD;
  1459.     }
  1460.     if (strEQ(d,"y")) {
  1461.         s = scantrans(s);
  1462.         TERM(TRANS);
  1463.     }
  1464.     break;
  1465.     case 'z': case 'Z':
  1466.     SNARFWORD;
  1467.     break;
  1468.     }
  1469.     yylval.cval = savestr(d);
  1470.     if (expectterm == 2) {        /* special case: start of statement */
  1471.     while (isSPACE(*s)) s++;
  1472.     if (*s == ':') {
  1473.         s++;
  1474.         CLINE;
  1475.         OPERATOR(LABEL);
  1476.     }
  1477.     TERM(WORD);
  1478.     }
  1479.     expectterm = FALSE;
  1480.     if (oldoldbufptr && oldoldbufptr < bufptr) {
  1481.     while (isSPACE(*oldoldbufptr))
  1482.         oldoldbufptr++;
  1483.     if (*oldoldbufptr == 'p' && strnEQ(oldoldbufptr,"print",5))
  1484.         expectterm = TRUE;
  1485.     else if (*oldoldbufptr == 's' && strnEQ(oldoldbufptr,"sort",4))
  1486.         expectterm = TRUE;
  1487.     }
  1488.     return (CLINE, bufptr = s, (int)WORD);
  1489. }
  1490.  
  1491. void
  1492. checkcomma(s,name,what)
  1493. register char *s;
  1494. char *name;
  1495. char *what;
  1496. {
  1497.     char *w;
  1498.  
  1499.     if (dowarn && *s == ' ' && s[1] == '(') {
  1500.     w = index(s,')');
  1501.     if (w)
  1502.         for (w++; *w && isSPACE(*w); w++) ;
  1503.     if (!w || !*w || !index(";|}", *w))    /* an advisory hack only... */
  1504.         warn("%s (...) interpreted as function",name);
  1505.     }
  1506.     while (s < bufend && isSPACE(*s))
  1507.     s++;
  1508.     if (*s == '(')
  1509.     s++;
  1510.     while (s < bufend && isSPACE(*s))
  1511.     s++;
  1512.     if (isALPHA(*s) || *s == '_') {
  1513.     w = s++;
  1514.     while (isALNUM(*s))
  1515.         s++;
  1516.     while (s < bufend && isSPACE(*s))
  1517.         s++;
  1518.     if (*s == ',') {
  1519.         *s = '\0';
  1520.         w = instr(
  1521.           "tell eof times getlogin wait length shift umask getppid \
  1522.           cos exp int log rand sin sqrt ord wantarray",
  1523.           w);
  1524.         *s = ',';
  1525.         if (w)
  1526.         return;
  1527.         fatal("No comma allowed after %s", what);
  1528.     }
  1529.     }
  1530. }
  1531.  
  1532. char *
  1533. scanident(s,send,dest)
  1534. register char *s;
  1535. register char *send;
  1536. char *dest;
  1537. {
  1538.     register char *d;
  1539.     int brackets = 0;
  1540.  
  1541.     reparse = Nullch;
  1542.     s++;
  1543.     d = dest;
  1544.     if (isDIGIT(*s)) {
  1545.     while (isDIGIT(*s))
  1546.         *d++ = *s++;
  1547.     }
  1548.     else {
  1549.     while (isALNUM(*s) || *s == '\'')
  1550.         *d++ = *s++;
  1551.     }
  1552.     while (d > dest+1 && d[-1] == '\'')
  1553.     d--,s--;
  1554.     *d = '\0';
  1555.     d = dest;
  1556.     if (!*d) {
  1557.     *d = *s++;
  1558.     if (*d == '{' /* } */ ) {
  1559.         d = dest;
  1560.         brackets++;
  1561.         while (s < send && brackets) {
  1562.         if (!reparse && (d == dest || (*s && isALNUM(*s) ))) {
  1563.             *d++ = *s++;
  1564.             continue;
  1565.         }
  1566.         else if (!reparse)
  1567.             reparse = s;
  1568.         switch (*s++) {
  1569.         /* { */
  1570.         case '}':
  1571.             brackets--;
  1572.             if (reparse && reparse == s - 1)
  1573.             reparse = Nullch;
  1574.             break;
  1575.         case '{':   /* } */
  1576.             brackets++;
  1577.             break;
  1578.         }
  1579.         }
  1580.         *d = '\0';
  1581.         d = dest;
  1582.     }
  1583.     else
  1584.         d[1] = '\0';
  1585.     }
  1586.     if (*d == '^' && (isUPPER(*s) || index("[\\]^_?", *s))) {
  1587. #ifdef DEBUGGING
  1588.     if (*s == 'D')
  1589.         debug |= 32768;
  1590. #endif
  1591.     *d = *s++ ^ 64;
  1592.     }
  1593.     return s;
  1594. }
  1595.  
  1596. void
  1597. scanconst(spat,string,len)
  1598. SPAT *spat;
  1599. char *string;
  1600. int len;
  1601. {
  1602.     register STR *tmpstr;
  1603.     register char *t;
  1604.     register char *d;
  1605.     register char *e;
  1606.     char *origstring = string;
  1607.     static char *vert = "|";
  1608.  
  1609.     if (ninstr(string, string+len, vert, vert+1))
  1610.     return;
  1611.     if (*string == '^')
  1612.     string++, len--;
  1613.     tmpstr = Str_new(86,len);
  1614.     str_nset(tmpstr,string,len);
  1615.     t = str_get(tmpstr);
  1616.     e = t + len;
  1617.     tmpstr->str_u.str_useful = 100;
  1618.     for (d=t; d < e; ) {
  1619.     switch (*d) {
  1620.     case '{':
  1621.         if (isDIGIT(d[1]))
  1622.         e = d;
  1623.         else
  1624.         goto defchar;
  1625.         break;
  1626.     case '.': case '[': case '$': case '(': case ')': case '|': case '+':
  1627.     case '^':
  1628.         e = d;
  1629.         break;
  1630.     case '\\':
  1631.         if (d[1] && index("wWbB0123456789sSdDlLuUExc",d[1])) {
  1632.         e = d;
  1633.         break;
  1634.         }
  1635.         Move(d+1,d,e-d,char);
  1636.         e--;
  1637.         switch(*d) {
  1638.         case 'n':
  1639.         *d = '\n';
  1640.         break;
  1641.         case 't':
  1642.         *d = '\t';
  1643.         break;
  1644.         case 'f':
  1645.         *d = '\f';
  1646.         break;
  1647.         case 'r':
  1648.         *d = '\r';
  1649.         break;
  1650.         case 'e':
  1651.         *d = '\033';
  1652.         break;
  1653.         case 'a':
  1654.         *d = '\007';
  1655.         break;
  1656.         }
  1657.         /* FALL THROUGH */
  1658.     default:
  1659.       defchar:
  1660.         if (d[1] == '*' || (d[1] == '{' && d[2] == '0') || d[1] == '?') {
  1661.         e = d;
  1662.         break;
  1663.         }
  1664.         d++;
  1665.     }
  1666.     }
  1667.     if (d == t) {
  1668.     str_free(tmpstr);
  1669.     return;
  1670.     }
  1671.     *d = '\0';
  1672.     tmpstr->str_cur = d - t;
  1673.     if (d == t+len)
  1674.     spat->spat_flags |= SPAT_ALL;
  1675.     if (*origstring != '^')
  1676.     spat->spat_flags |= SPAT_SCANFIRST;
  1677.     spat->spat_short = tmpstr;
  1678.     spat->spat_slen = d - t;
  1679. }
  1680.  
  1681. char *
  1682. scanpat(s)
  1683. register char *s;
  1684. {
  1685.     register SPAT *spat;
  1686.     register char *d;
  1687.     register char *e;
  1688.     int len;
  1689.     SPAT savespat;
  1690.     STR *str = Str_new(93,0);
  1691.     char delim;
  1692.  
  1693.     Newz(801,spat,1,SPAT);
  1694.     spat->spat_next = curstash->tbl_spatroot;    /* link into spat list */
  1695.     curstash->tbl_spatroot = spat;
  1696.  
  1697.     switch (*s++) {
  1698.     case 'm':
  1699.     s++;
  1700.     break;
  1701.     case '/':
  1702.     break;
  1703.     case '?':
  1704.     spat->spat_flags |= SPAT_ONCE;
  1705.     break;
  1706.     default:
  1707.     fatal("panic: scanpat");
  1708.     }
  1709.     s = str_append_till(str,s,bufend,s[-1],patleave);
  1710.     if (s >= bufend) {
  1711.     str_free(str);
  1712.     yyerror("Search pattern not terminated");
  1713.     yylval.arg = Nullarg;
  1714.     return s;
  1715.     }
  1716.     delim = *s++;
  1717.     while (*s == 'i' || *s == 'o' || *s == 'g') {
  1718.     if (*s == 'i') {
  1719.         s++;
  1720.         sawi = TRUE;
  1721.         spat->spat_flags |= SPAT_FOLD;
  1722.     }
  1723.     if (*s == 'o') {
  1724.         s++;
  1725.         spat->spat_flags |= SPAT_KEEP;
  1726.     }
  1727.     if (*s == 'g') {
  1728.         s++;
  1729.         spat->spat_flags |= SPAT_GLOBAL;
  1730.     }
  1731.     }
  1732.     len = str->str_cur;
  1733.     e = str->str_ptr + len;
  1734.     if (delim == '\'')
  1735.     d = e;
  1736.     else
  1737.     d = str->str_ptr;
  1738.     for (; d < e; d++) {
  1739.     if (*d == '\\')
  1740.         d++;
  1741.     else if ((*d == '$' && d[1] && d[1] != '|' && d[1] != ')') ||
  1742.          (*d == '@')) {
  1743.         register ARG *arg;
  1744.  
  1745.         spat->spat_runtime = arg = op_new(1);
  1746.         arg->arg_type = O_ITEM;
  1747.         arg[1].arg_type = A_DOUBLE;
  1748.         arg[1].arg_ptr.arg_str = str_smake(str);
  1749.         d = scanident(d,bufend,buf);
  1750.         (void)stabent(buf,TRUE);        /* make sure it's created */
  1751.         for (; d < e; d++) {
  1752.         if (*d == '\\')
  1753.             d++;
  1754.         else if (*d == '$' && d[1] && d[1] != '|' && d[1] != ')') {
  1755.             d = scanident(d,bufend,buf);
  1756.             (void)stabent(buf,TRUE);
  1757.         }
  1758.         else if (*d == '@') {
  1759.             d = scanident(d,bufend,buf);
  1760.             if (strEQ(buf,"ARGV") || strEQ(buf,"ENV") ||
  1761.               strEQ(buf,"SIG") || strEQ(buf,"INC"))
  1762.             (void)stabent(buf,TRUE);
  1763.         }
  1764.         }
  1765.         goto got_pat;        /* skip compiling for now */
  1766.     }
  1767.     }
  1768.     if (spat->spat_flags & SPAT_FOLD)
  1769.     StructCopy(spat, &savespat, SPAT);
  1770.     scanconst(spat,str->str_ptr,len);
  1771.     if ((spat->spat_flags & SPAT_ALL) && (spat->spat_flags & SPAT_SCANFIRST)) {
  1772.     fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1773.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1774.         spat->spat_flags & SPAT_FOLD);
  1775.         /* Note that this regexp can still be used if someone says
  1776.          * something like /a/ && s//b/;  so we can't delete it.
  1777.          */
  1778.     }
  1779.     else {
  1780.     if (spat->spat_flags & SPAT_FOLD)
  1781.     StructCopy(&savespat, spat, SPAT);
  1782.     if (spat->spat_short)
  1783.         fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1784.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1785.         spat->spat_flags & SPAT_FOLD);
  1786.     hoistmust(spat);
  1787.     }
  1788.   got_pat:
  1789.     str_free(str);
  1790.     yylval.arg = make_match(O_MATCH,stab2arg(A_STAB,defstab),spat);
  1791.     return s;
  1792. }
  1793.  
  1794. char *
  1795. scansubst(start)
  1796. char *start;
  1797. {
  1798.     register char *s = start;
  1799.     register SPAT *spat;
  1800.     register char *d;
  1801.     register char *e;
  1802.     int len;
  1803.     STR *str = Str_new(93,0);
  1804.     char term = *s;
  1805.  
  1806.     if (term && (d = index("([{< )]}> )]}>",term)))
  1807.     term = d[5];
  1808.  
  1809.     Newz(802,spat,1,SPAT);
  1810.     spat->spat_next = curstash->tbl_spatroot;    /* link into spat list */
  1811.     curstash->tbl_spatroot = spat;
  1812.  
  1813.     s = str_append_till(str,s+1,bufend,term,patleave);
  1814.     if (s >= bufend) {
  1815.     str_free(str);
  1816.     yyerror("Substitution pattern not terminated");
  1817.     yylval.arg = Nullarg;
  1818.     return s;
  1819.     }
  1820.     len = str->str_cur;
  1821.     e = str->str_ptr + len;
  1822.     for (d = str->str_ptr; d < e; d++) {
  1823.     if (*d == '\\')
  1824.         d++;
  1825.     else if ((*d == '$' && d[1] && d[1] != '|' && /*(*/ d[1] != ')') ||
  1826.         *d == '@' ) {
  1827.         register ARG *arg;
  1828.  
  1829.         spat->spat_runtime = arg = op_new(1);
  1830.         arg->arg_type = O_ITEM;
  1831.         arg[1].arg_type = A_DOUBLE;
  1832.         arg[1].arg_ptr.arg_str = str_smake(str);
  1833.         d = scanident(d,e,buf);
  1834.         (void)stabent(buf,TRUE);        /* make sure it's created */
  1835.         for (; *d; d++) {
  1836.         if (*d == '$' && d[1] && d[-1] != '\\' && d[1] != '|') {
  1837.             d = scanident(d,e,buf);
  1838.             (void)stabent(buf,TRUE);
  1839.         }
  1840.         else if (*d == '@' && d[-1] != '\\') {
  1841.             d = scanident(d,e,buf);
  1842.             if (strEQ(buf,"ARGV") || strEQ(buf,"ENV") ||
  1843.               strEQ(buf,"SIG") || strEQ(buf,"INC"))
  1844.             (void)stabent(buf,TRUE);
  1845.         }
  1846.         }
  1847.         goto get_repl;        /* skip compiling for now */
  1848.     }
  1849.     }
  1850.     scanconst(spat,str->str_ptr,len);
  1851. get_repl:
  1852.     if (term != *start)
  1853.     s++;
  1854.     s = scanstr(s, SCAN_REPL);
  1855.     if (s >= bufend) {
  1856.     str_free(str);
  1857.     yyerror("Substitution replacement not terminated");
  1858.     yylval.arg = Nullarg;
  1859.     return s;
  1860.     }
  1861.     spat->spat_repl = yylval.arg;
  1862.     if ((spat->spat_repl[1].arg_type & A_MASK) == A_SINGLE)
  1863.     spat->spat_flags |= SPAT_CONST;
  1864.     else if ((spat->spat_repl[1].arg_type & A_MASK) == A_DOUBLE) {
  1865.     STR *tmpstr;
  1866.     register char *t;
  1867.  
  1868.     spat->spat_flags |= SPAT_CONST;
  1869.     tmpstr = spat->spat_repl[1].arg_ptr.arg_str;
  1870.     e = tmpstr->str_ptr + tmpstr->str_cur;
  1871.     for (t = tmpstr->str_ptr; t < e; t++) {
  1872.         if (*t == '$' && t[1] && (index("`'&+0123456789",t[1]) ||
  1873.           (t[1] == '{' /*}*/ && isDIGIT(t[2])) ))
  1874.         spat->spat_flags &= ~SPAT_CONST;
  1875.     }
  1876.     }
  1877.     while (*s == 'g' || *s == 'i' || *s == 'e' || *s == 'o') {
  1878.     int es = 0;
  1879.  
  1880.     if (*s == 'e') {
  1881.         s++;
  1882.         es++;
  1883.         if ((spat->spat_repl[1].arg_type & A_MASK) == A_DOUBLE)
  1884.         spat->spat_repl[1].arg_type = A_SINGLE;
  1885.         spat->spat_repl = make_op(
  1886.         (!es && spat->spat_repl[1].arg_type == A_SINGLE
  1887.             ? O_EVALONCE
  1888.             : O_EVAL),
  1889.         2,
  1890.         spat->spat_repl,
  1891.         Nullarg,
  1892.         Nullarg);
  1893.         spat->spat_flags &= ~SPAT_CONST;
  1894.     }
  1895.     if (*s == 'g') {
  1896.         s++;
  1897.         spat->spat_flags |= SPAT_GLOBAL;
  1898.     }
  1899.     if (*s == 'i') {
  1900.         s++;
  1901.         sawi = TRUE;
  1902.         spat->spat_flags |= SPAT_FOLD;
  1903.         if (!(spat->spat_flags & SPAT_SCANFIRST)) {
  1904.         str_free(spat->spat_short);    /* anchored opt doesn't do */
  1905.         spat->spat_short = Nullstr;    /* case insensitive match */
  1906.         spat->spat_slen = 0;
  1907.         }
  1908.     }
  1909.     if (*s == 'o') {
  1910.         s++;
  1911.         spat->spat_flags |= SPAT_KEEP;
  1912.     }
  1913.     }
  1914.     if (spat->spat_short && (spat->spat_flags & SPAT_SCANFIRST))
  1915.     fbmcompile(spat->spat_short, spat->spat_flags & SPAT_FOLD);
  1916.     if (!spat->spat_runtime) {
  1917.     spat->spat_regexp = regcomp(str->str_ptr,str->str_ptr+len,
  1918.       spat->spat_flags & SPAT_FOLD);
  1919.     hoistmust(spat);
  1920.     }
  1921.     yylval.arg = make_match(O_SUBST,stab2arg(A_STAB,defstab),spat);
  1922.     str_free(str);
  1923.     return s;
  1924. }
  1925.  
  1926. void
  1927. hoistmust(spat)
  1928. register SPAT *spat;
  1929. {
  1930.     if (!spat->spat_short && spat->spat_regexp->regstart &&
  1931.     (!spat->spat_regexp->regmust || spat->spat_regexp->reganch & ROPT_ANCH)
  1932.        ) {
  1933.     if (!(spat->spat_regexp->reganch & ROPT_ANCH))
  1934.         spat->spat_flags |= SPAT_SCANFIRST;
  1935.     else if (spat->spat_flags & SPAT_FOLD)
  1936.         return;
  1937.     spat->spat_short = str_smake(spat->spat_regexp->regstart);
  1938.     }
  1939.     else if (spat->spat_regexp->regmust) {/* is there a better short-circuit? */
  1940.     if (spat->spat_short &&
  1941.       str_eq(spat->spat_short,spat->spat_regexp->regmust))
  1942.     {
  1943.         if (spat->spat_flags & SPAT_SCANFIRST) {
  1944.         str_free(spat->spat_short);
  1945.         spat->spat_short = Nullstr;
  1946.         }
  1947.         else {
  1948.         str_free(spat->spat_regexp->regmust);
  1949.         spat->spat_regexp->regmust = Nullstr;
  1950.         return;
  1951.         }
  1952.     }
  1953.     if (!spat->spat_short ||    /* promote the better string */
  1954.       ((spat->spat_flags & SPAT_SCANFIRST) &&
  1955.        (spat->spat_short->str_cur < spat->spat_regexp->regmust->str_cur) )){
  1956.         str_free(spat->spat_short);        /* ok if null */
  1957.         spat->spat_short = spat->spat_regexp->regmust;
  1958.         spat->spat_regexp->regmust = Nullstr;
  1959.         spat->spat_flags |= SPAT_SCANFIRST;
  1960.     }
  1961.     }
  1962. }
  1963.  
  1964. char *
  1965. scantrans(start)
  1966. char *start;
  1967. {
  1968.     register char *s = start;
  1969.     ARG *arg =
  1970.     l(make_op(O_TRANS,2,stab2arg(A_STAB,defstab),Nullarg,Nullarg));
  1971.     STR *tstr;
  1972.     STR *rstr;
  1973.     register char *t;
  1974.     register char *r;
  1975.     register short *tbl;
  1976.     register int i;
  1977.     register int j;
  1978.     int tlen, rlen;
  1979.     int squash;
  1980.     int delete;
  1981.     int complement;
  1982.  
  1983.     New(803,tbl,256,short);
  1984.     arg[2].arg_type = A_NULL;
  1985.     arg[2].arg_ptr.arg_cval = (char*) tbl;
  1986.  
  1987.     s = scanstr(s, SCAN_TR);
  1988.     if (s >= bufend) {
  1989.     yyerror("Translation pattern not terminated");
  1990.     yylval.arg = Nullarg;
  1991.     return s;
  1992.     }
  1993.     tstr = yylval.arg[1].arg_ptr.arg_str; 
  1994.     yylval.arg[1].arg_ptr.arg_str = Nullstr; 
  1995.     arg_free(yylval.arg);
  1996.     t = tstr->str_ptr;
  1997.     tlen = tstr->str_cur;
  1998.  
  1999.     if (s[-1] == *start)
  2000.     s--;
  2001.  
  2002.     s = scanstr(s, SCAN_TR|SCAN_REPL);
  2003.     if (s >= bufend) {
  2004.     yyerror("Translation replacement not terminated");
  2005.     yylval.arg = Nullarg;
  2006.     return s;
  2007.     }
  2008.     rstr = yylval.arg[1].arg_ptr.arg_str; 
  2009.     yylval.arg[1].arg_ptr.arg_str = Nullstr; 
  2010.     arg_free(yylval.arg);
  2011.     r = rstr->str_ptr;
  2012.     rlen = rstr->str_cur;
  2013.  
  2014.     complement = delete = squash = 0;
  2015.     while (*s == 'c' || *s == 'd' || *s == 's') {
  2016.     if (*s == 'c')
  2017.         complement = 1;
  2018.     else if (*s == 'd')
  2019.         delete = 2;
  2020.     else
  2021.         squash = 1;
  2022.     s++;
  2023.     }
  2024.     arg[2].arg_len = delete|squash;
  2025.     yylval.arg = arg;
  2026.     if (complement) {
  2027.     Zero(tbl, 256, short);
  2028.     for (i = 0; i < tlen; i++)
  2029.         tbl[t[i] & 0377] = -1;
  2030.     for (i = 0, j = 0; i < 256; i++) {
  2031.         if (!tbl[i]) {
  2032.         if (j >= rlen) {
  2033.             if (delete)
  2034.             tbl[i] = -2;
  2035.             else if (rlen)
  2036.             tbl[i] = r[j-1] & 0377;
  2037.             else
  2038.             tbl[i] = i;
  2039.         }
  2040.         else
  2041.             tbl[i] = r[j++] & 0377;
  2042.         }
  2043.     }
  2044.     }
  2045.     else {
  2046.     if (!rlen && !delete) {
  2047.         r = t; rlen = tlen;
  2048.     }
  2049.     for (i = 0; i < 256; i++)
  2050.         tbl[i] = -1;
  2051.     for (i = 0, j = 0; i < tlen; i++,j++) {
  2052.         if (j >= rlen) {
  2053.         if (delete) {
  2054.             if (tbl[t[i] & 0377] == -1)
  2055.             tbl[t[i] & 0377] = -2;
  2056.             continue;
  2057.         }
  2058.         --j;
  2059.         }
  2060.         if (tbl[t[i] & 0377] == -1)
  2061.         tbl[t[i] & 0377] = r[j] & 0377;
  2062.     }
  2063.     }
  2064.     str_free(tstr);
  2065.     str_free(rstr);
  2066.     return s;
  2067. }
  2068.  
  2069. char *
  2070. scanstr(start, in_what)
  2071. char *start;
  2072. int in_what;
  2073. {
  2074.     register char *s = start;
  2075.     register char term;
  2076.     register char *d;
  2077.     register ARG *arg;
  2078.     register char *send;
  2079.     register bool makesingle = FALSE;
  2080.     register STAB *stab;
  2081.     bool alwaysdollar = FALSE;
  2082.     bool hereis = FALSE;
  2083.     STR *herewas;
  2084.     STR *str;
  2085.     /* which backslash sequences to keep */
  2086.     char *leave = (in_what & SCAN_TR)
  2087.     ? "\\$@nrtfbeacx0123456789-"
  2088.     : "\\$@nrtfbeacx0123456789[{]}lLuUE";
  2089.     int len;
  2090.  
  2091.     arg = op_new(1);
  2092.     yylval.arg = arg;
  2093.     arg->arg_type = O_ITEM;
  2094.  
  2095.     switch (*s) {
  2096.     default:            /* a substitution replacement */
  2097.     arg[1].arg_type = A_DOUBLE;
  2098.     makesingle = TRUE;    /* maybe disable runtime scanning */
  2099.     term = *s;
  2100.     if (term == '\'')
  2101.         leave = Nullch;
  2102.     goto snarf_it;
  2103.     case '0':
  2104.     {
  2105.         unsigned long i;
  2106.         int shift;
  2107.  
  2108.         arg[1].arg_type = A_SINGLE;
  2109.         if (s[1] == 'x') {
  2110.         shift = 4;
  2111.         s += 2;
  2112.         }
  2113.         else if (s[1] == '.')
  2114.         goto decimal;
  2115.         else
  2116.         shift = 3;
  2117.         i = 0;
  2118.         for (;;) {
  2119.         switch (*s) {
  2120.         default:
  2121.             goto out;
  2122.         case '_':
  2123.             s++;
  2124.             break;
  2125.         case '8': case '9':
  2126.             if (shift != 4)
  2127.             yyerror("Illegal octal digit");
  2128.             /* FALL THROUGH */
  2129.         case '0': case '1': case '2': case '3': case '4':
  2130.         case '5': case '6': case '7':
  2131.             i <<= shift;
  2132.             i += *s++ & 15;
  2133.             break;
  2134.         case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
  2135.         case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
  2136.             if (shift != 4)
  2137.             goto out;
  2138.             i <<= 4;
  2139.             i += (*s++ & 7) + 9;
  2140.             break;
  2141.         }
  2142.         }
  2143.       out:
  2144.         str = Str_new(92,0);
  2145.         str_numset(str,(double)i);
  2146.         if (str->str_ptr) {
  2147.         Safefree(str->str_ptr);
  2148.         str->str_ptr = Nullch;
  2149.         str->str_len = str->str_cur = 0;
  2150.         }
  2151.         arg[1].arg_ptr.arg_str = str;
  2152.     }
  2153.     break;
  2154.     case '1': case '2': case '3': case '4': case '5':
  2155.     case '6': case '7': case '8': case '9': case '.':
  2156.       decimal:
  2157.     arg[1].arg_type = A_SINGLE;
  2158.     d = tokenbuf;
  2159.     while (isDIGIT(*s) || *s == '_') {
  2160.         if (*s == '_')
  2161.         s++;
  2162.         else
  2163.         *d++ = *s++;
  2164.     }
  2165.     if (*s == '.' && s[1] != '.') {
  2166.         *d++ = *s++;
  2167.         while (isDIGIT(*s) || *s == '_') {
  2168.         if (*s == '_')
  2169.             s++;
  2170.         else
  2171.             *d++ = *s++;
  2172.         }
  2173.     }
  2174.     if (*s && index("eE",*s) && index("+-0123456789",s[1])) {
  2175.         *d++ = *s++;
  2176.         if (*s == '+' || *s == '-')
  2177.         *d++ = *s++;
  2178.         while (isDIGIT(*s))
  2179.         *d++ = *s++;
  2180.     }
  2181.     *d = '\0';
  2182.     str = Str_new(92,0);
  2183.     str_numset(str,atof(tokenbuf));
  2184.     if (str->str_ptr) {
  2185.         Safefree(str->str_ptr);
  2186.         str->str_ptr = Nullch;
  2187.         str->str_len = str->str_cur = 0;
  2188.     }
  2189.     arg[1].arg_ptr.arg_str = str;
  2190.     break;
  2191.     case '<':
  2192.     if (in_what & (SCAN_REPL|SCAN_TR))
  2193.         goto do_double;
  2194.     if (*++s == '<') {
  2195.         hereis = TRUE;
  2196.         d = tokenbuf;
  2197.         if (!rsfp)
  2198.         *d++ = '\n';
  2199.         if (*++s && index("`'\"",*s)) {
  2200.         term = *s++;
  2201.         s = cpytill(d,s,bufend,term,&len);
  2202.         if (s < bufend)
  2203.             s++;
  2204.         d += len;
  2205.         }
  2206.         else {
  2207.         if (*s == '\\')
  2208.             s++, term = '\'';
  2209.         else
  2210.             term = '"';
  2211.         while (isALNUM(*s))
  2212.             *d++ = *s++;
  2213.         }                /* assuming tokenbuf won't clobber */
  2214.         *d++ = '\n';
  2215.         *d = '\0';
  2216.         len = d - tokenbuf;
  2217.         d = "\n";
  2218.         if (rsfp || !(d=ninstr(s,bufend,d,d+1)))
  2219.         herewas = str_make(s,bufend-s);
  2220.         else
  2221.         s--, herewas = str_make(s,d-s);
  2222.         s += herewas->str_cur;
  2223.         if (term == '\'')
  2224.         goto do_single;
  2225.         if (term == '`')
  2226.         goto do_back;
  2227.         goto do_double;
  2228.     }
  2229.     d = tokenbuf;
  2230.     s = cpytill(d,s,bufend,'>',&len);
  2231.     if (s < bufend)
  2232.         s++;
  2233.     else
  2234.         fatal("Unterminated <> operator");
  2235.  
  2236.     if (*d == '$') d++;
  2237.     while (*d && (isALNUM(*d) || *d == '\''))
  2238.         d++;
  2239.     if (d - tokenbuf != len) {
  2240.         s = start;
  2241.         term = *s;
  2242.         arg[1].arg_type = A_GLOB;
  2243.         set_csh();
  2244.         alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2245.         goto snarf_it;
  2246.     }
  2247.     else {
  2248.         d = tokenbuf;
  2249.         if (!len)
  2250.         (void)strcpy(d,"ARGV");
  2251.         if (*d == '$') {
  2252.         arg[1].arg_type = A_INDREAD;
  2253.         arg[1].arg_ptr.arg_stab = stabent(d+1,TRUE);
  2254.         }
  2255.         else {
  2256.         arg[1].arg_type = A_READ;
  2257.         arg[1].arg_ptr.arg_stab = stabent(d,TRUE);
  2258.         if (!stab_io(arg[1].arg_ptr.arg_stab))
  2259.             stab_io(arg[1].arg_ptr.arg_stab) = stio_new();
  2260.         if (strEQ(d,"ARGV")) {
  2261.             (void)aadd(arg[1].arg_ptr.arg_stab);
  2262.             stab_io(arg[1].arg_ptr.arg_stab)->flags |=
  2263.               IOF_ARGV|IOF_START;
  2264.         }
  2265.         }
  2266.     }
  2267.     break;
  2268.  
  2269.     case 'q':
  2270.     s++;
  2271.     if (*s == 'q') {
  2272.         s++;
  2273.         goto do_double;
  2274.     }
  2275.     if (*s == 'x') {
  2276.         s++;
  2277.         goto do_back;
  2278.     }
  2279.     /* FALL THROUGH */
  2280.     case '\'':
  2281.       do_single:
  2282.     term = *s;
  2283.     arg[1].arg_type = A_SINGLE;
  2284.     leave = Nullch;
  2285.     goto snarf_it;
  2286.  
  2287.     case '"': 
  2288.       do_double:
  2289.     term = *s;
  2290.     arg[1].arg_type = A_DOUBLE;
  2291.     makesingle = TRUE;    /* maybe disable runtime scanning */
  2292.     alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2293.     goto snarf_it;
  2294.     case '`':
  2295.       do_back:
  2296.     term = *s;
  2297.     arg[1].arg_type = A_BACKTICK;
  2298.     set_csh();
  2299.     alwaysdollar = TRUE;    /* treat $) and $| as variables */
  2300.       snarf_it:
  2301.     {
  2302.         STR *tmpstr;
  2303.         STR *tmpstr2 = Nullstr;
  2304.         char *tmps;
  2305.         bool dorange = FALSE;
  2306.  
  2307.         CLINE;
  2308.         multi_start = curcmd->c_line;
  2309.         if (hereis)
  2310.         multi_open = multi_close = '<';
  2311.         else {
  2312.         multi_open = term;
  2313.         if (term && (tmps = index("([{< )]}> )]}>",term)))
  2314.             term = tmps[5];
  2315.         multi_close = term;
  2316.         }
  2317.         tmpstr = Str_new(87,80);
  2318.         if (hereis) {
  2319.         term = *tokenbuf;
  2320.         if (!rsfp) {
  2321.             d = s;
  2322.             while (s < bufend &&
  2323.               (*s != term || bcmp(s,tokenbuf,len) != 0) ) {
  2324.             if (*s++ == '\n')
  2325.                 curcmd->c_line++;
  2326.             }
  2327.             if (s >= bufend) {
  2328.             curcmd->c_line = multi_start;
  2329.             fatal("EOF in string");
  2330.             }
  2331.             str_nset(tmpstr,d+1,s-d);
  2332.             s += len - 1;
  2333.             str_ncat(herewas,s,bufend-s);
  2334.             str_replace(linestr,herewas);
  2335.             oldoldbufptr = oldbufptr = bufptr = s = str_get(linestr);
  2336.             bufend = linestr->str_ptr + linestr->str_cur;
  2337.             hereis = FALSE;
  2338.         }
  2339.         else
  2340.             str_nset(tmpstr,"",0);   /* avoid "uninitialized" warning */
  2341.         }
  2342.         else
  2343.         s = str_append_till(tmpstr,s+1,bufend,term,leave);
  2344.         while (s >= bufend) {    /* multiple line string? */
  2345.         if (!rsfp ||
  2346.          !(oldoldbufptr = oldbufptr = s = str_gets(linestr, rsfp, 0))) {
  2347.             curcmd->c_line = multi_start;
  2348.             fatal("EOF in string");
  2349.         }
  2350.         curcmd->c_line++;
  2351.         if (perldb) {
  2352.             STR *str = Str_new(88,0);
  2353.  
  2354.             str_sset(str,linestr);
  2355.             astore(stab_xarray(curcmd->c_filestab),
  2356.               (int)curcmd->c_line,str);
  2357.         }
  2358.         bufend = linestr->str_ptr + linestr->str_cur;
  2359.         if (hereis) {
  2360.             if (*s == term && bcmp(s,tokenbuf,len) == 0) {
  2361.             s = bufend - 1;
  2362.             *s = ' ';
  2363.             str_scat(linestr,herewas);
  2364.             bufend = linestr->str_ptr + linestr->str_cur;
  2365.             }
  2366.             else {
  2367.             s = bufend;
  2368.             str_scat(tmpstr,linestr);
  2369.             }
  2370.         }
  2371.         else
  2372.             s = str_append_till(tmpstr,s,bufend,term,leave);
  2373.         }
  2374.         multi_end = curcmd->c_line;
  2375.         s++;
  2376.         if (tmpstr->str_cur + 5 < tmpstr->str_len) {
  2377.         tmpstr->str_len = tmpstr->str_cur + 1;
  2378.         Renew(tmpstr->str_ptr, tmpstr->str_len, char);
  2379.         }
  2380.         if (arg[1].arg_type == A_SINGLE) {
  2381.         arg[1].arg_ptr.arg_str = tmpstr;
  2382.         break;
  2383.         }
  2384.         tmps = s;
  2385.         s = tmpstr->str_ptr;
  2386.         send = s + tmpstr->str_cur;
  2387.         while (s < send) {        /* see if we can make SINGLE */
  2388.         if (*s == '\\' && s[1] && isDIGIT(s[1]) && !isDIGIT(s[2]) &&
  2389.           !alwaysdollar && s[1] != '0')
  2390.             *s = '$';        /* grandfather \digit in subst */
  2391.         if ((*s == '$' || *s == '@') && s+1 < send &&
  2392.           (alwaysdollar || (s[1] != ')' && s[1] != '|'))) {
  2393.             makesingle = FALSE;    /* force interpretation */
  2394.         }
  2395.         else if (*s == '\\' && s+1 < send) {
  2396.             if (index("lLuUE",s[1]))
  2397.             makesingle = FALSE;
  2398.             s++;
  2399.         }
  2400.         s++;
  2401.         }
  2402.         s = d = tmpstr->str_ptr;    /* assuming shrinkage only */
  2403.         while (s < send || dorange) {
  2404.         if (in_what & SCAN_TR) {
  2405.             if (dorange) {
  2406.             int i;
  2407.             int max;
  2408.             if (!tmpstr2) {    /* oops, have to grow */
  2409.                 tmpstr2 = str_smake(tmpstr);
  2410.                 s = tmpstr2->str_ptr + (s - tmpstr->str_ptr);
  2411.                 send = tmpstr2->str_ptr + (send - tmpstr->str_ptr);
  2412.             }
  2413.             i = d - tmpstr->str_ptr;
  2414.             STR_GROW(tmpstr, tmpstr->str_len + 256);
  2415.             d = tmpstr->str_ptr + i;
  2416.             d -= 2;
  2417.             max = d[1] & 0377;
  2418.             for (i = (*d & 0377); i <= max; i++)
  2419.                 *d++ = i;
  2420.             dorange = FALSE;
  2421.             continue;
  2422.             }
  2423.             else if (*s == '-' && s+1 < send  && d != tmpstr->str_ptr) {
  2424.             dorange = TRUE;
  2425.             s++;
  2426.             }
  2427.         }
  2428.         else {
  2429.             if ((*s == '$' && s+1 < send &&
  2430.             (alwaysdollar || /*(*/(s[1] != ')' && s[1] != '|')) ) ||
  2431.             (*s == '@' && s+1 < send) ) {
  2432.             if (s[1] == '#' && (isALPHA(s[2]) || s[2] == '_'))
  2433.                 *d++ = *s++;
  2434.             len = scanident(s,send,tokenbuf) - s;
  2435.             if (*s == '$' || strEQ(tokenbuf,"ARGV")
  2436.               || strEQ(tokenbuf,"ENV")
  2437.               || strEQ(tokenbuf,"SIG")
  2438.               || strEQ(tokenbuf,"INC") )
  2439.                 (void)stabent(tokenbuf,TRUE); /* add symbol */
  2440.             while (len--)
  2441.                 *d++ = *s++;
  2442.             continue;
  2443.             }
  2444.         }
  2445.         if (*s == '\\' && s+1 < send) {
  2446.             s++;
  2447.             switch (*s) {
  2448.             case '-':
  2449.             if (in_what & SCAN_TR) {
  2450.                 *d++ = *s++;
  2451.                 continue;
  2452.             }
  2453.             /* FALL THROUGH */
  2454.             default:
  2455.             if (!makesingle && (!leave || (*s && index(leave,*s))))
  2456.                 *d++ = '\\';
  2457.             *d++ = *s++;
  2458.             continue;
  2459.             case '0': case '1': case '2': case '3':
  2460.             case '4': case '5': case '6': case '7':
  2461.             *d++ = scanoct(s, 3, &len);
  2462.             s += len;
  2463.             continue;
  2464.             case 'x':
  2465.             *d++ = scanhex(++s, 2, &len);
  2466.             s += len;
  2467.             continue;
  2468.             case 'c':
  2469.             s++;
  2470.             *d = *s++;
  2471.             if (isLOWER(*d))
  2472.                 *d = toupper(*d);
  2473.             *d++ ^= 64;
  2474.             continue;
  2475.             case 'b':
  2476.             *d++ = '\b';
  2477.             break;
  2478.             case 'n':
  2479.             *d++ = '\n';
  2480.             break;
  2481.             case 'r':
  2482.             *d++ = '\r';
  2483.             break;
  2484.             case 'f':
  2485.             *d++ = '\f';
  2486.             break;
  2487.             case 't':
  2488.             *d++ = '\t';
  2489.             break;
  2490.             case 'e':
  2491.             *d++ = '\033';
  2492.             break;
  2493.             case 'a':
  2494.             *d++ = '\007';
  2495.             break;
  2496.             }
  2497.             s++;
  2498.             continue;
  2499.         }
  2500.         *d++ = *s++;
  2501.         }
  2502.         *d = '\0';
  2503.  
  2504.         if (arg[1].arg_type == A_DOUBLE && makesingle)
  2505.         arg[1].arg_type = A_SINGLE;    /* now we can optimize on it */
  2506.  
  2507.         tmpstr->str_cur = d - tmpstr->str_ptr;
  2508.         if (arg[1].arg_type == A_GLOB) {
  2509.         arg[1].arg_ptr.arg_stab = stab = genstab();
  2510.         stab_io(stab) = stio_new();
  2511.         str_sset(stab_val(stab), tmpstr);
  2512.         }
  2513.         else
  2514.         arg[1].arg_ptr.arg_str = tmpstr;
  2515.         s = tmps;
  2516.         if (tmpstr2)
  2517.         str_free(tmpstr2);
  2518.         break;
  2519.     }
  2520.     }
  2521.     if (hereis)
  2522.     str_free(herewas);
  2523.     return s;
  2524. }
  2525.  
  2526. FCMD *
  2527. load_format()
  2528. {
  2529.     FCMD froot;
  2530.     FCMD *flinebeg;
  2531.     char *eol;
  2532.     register FCMD *fprev = &froot;
  2533.     register FCMD *fcmd;
  2534.     register char *s;
  2535.     register char *t;
  2536.     register STR *str;
  2537.     bool noblank;
  2538.     bool repeater;
  2539.  
  2540.     Zero(&froot, 1, FCMD);
  2541.     s = bufptr;
  2542.     while (s < bufend || (rsfp && (s = str_gets(linestr,rsfp, 0)) != Nullch)) {
  2543.     curcmd->c_line++;
  2544.     if (in_eval && !rsfp) {
  2545.         eol = index(s,'\n');
  2546.         if (!eol++)
  2547.         eol = bufend;
  2548.     }
  2549.     else
  2550.         eol = bufend = linestr->str_ptr + linestr->str_cur;
  2551.     if (perldb) {
  2552.         STR *tmpstr = Str_new(89,0);
  2553.  
  2554.         str_nset(tmpstr, s, eol-s);
  2555.         astore(stab_xarray(curcmd->c_filestab), (int)curcmd->c_line,tmpstr);
  2556.     }
  2557.     if (*s == '.') {
  2558.         /*SUPPRESS 530*/
  2559.         for (t = s+1; *t == ' ' || *t == '\t'; t++) ;
  2560.         if (*t == '\n') {
  2561.         bufptr = s;
  2562.         return froot.f_next;
  2563.         }
  2564.     }
  2565.     if (*s == '#') {
  2566.         s = eol;
  2567.         continue;
  2568.     }
  2569.     flinebeg = Nullfcmd;
  2570.     noblank = FALSE;
  2571.     repeater = FALSE;
  2572.     while (s < eol) {
  2573.         Newz(804,fcmd,1,FCMD);
  2574.         fprev->f_next = fcmd;
  2575.         fprev = fcmd;
  2576.         for (t=s; t < eol && *t != '@' && *t != '^'; t++) {
  2577.         if (*t == '~') {
  2578.             noblank = TRUE;
  2579.             *t = ' ';
  2580.             if (t[1] == '~') {
  2581.             repeater = TRUE;
  2582.             t[1] = ' ';
  2583.             }
  2584.         }
  2585.         }
  2586.         fcmd->f_pre = nsavestr(s, t-s);
  2587.         fcmd->f_presize = t-s;
  2588.         s = t;
  2589.         if (s >= eol) {
  2590.         if (noblank)
  2591.             fcmd->f_flags |= FC_NOBLANK;
  2592.         if (repeater)
  2593.             fcmd->f_flags |= FC_REPEAT;
  2594.         break;
  2595.         }
  2596.         if (!flinebeg)
  2597.         flinebeg = fcmd;        /* start values here */
  2598.         if (*s++ == '^')
  2599.         fcmd->f_flags |= FC_CHOP;    /* for doing text filling */
  2600.         switch (*s) {
  2601.         case '*':
  2602.         fcmd->f_type = F_LINES;
  2603.         *s = '\0';
  2604.         break;
  2605.         case '<':
  2606.         fcmd->f_type = F_LEFT;
  2607.         while (*s == '<')
  2608.             s++;
  2609.         break;
  2610.         case '>':
  2611.         fcmd->f_type = F_RIGHT;
  2612.         while (*s == '>')
  2613.             s++;
  2614.         break;
  2615.         case '|':
  2616.         fcmd->f_type = F_CENTER;
  2617.         while (*s == '|')
  2618.             s++;
  2619.         break;
  2620.         case '#':
  2621.         case '.':
  2622.         /* Catch the special case @... and handle it as a string
  2623.            field. */
  2624.         if (*s == '.' && s[1] == '.') {
  2625.             goto default_format;
  2626.         }
  2627.         fcmd->f_type = F_DECIMAL;
  2628.         {
  2629.             char *p;
  2630.  
  2631.             /* Read a format in the form @####.####, where either group
  2632.                of ### may be empty, or the final .### may be missing. */
  2633.             while (*s == '#')
  2634.             s++;
  2635.             if (*s == '.') {
  2636.             s++;
  2637.             p = s;
  2638.             while (*s == '#')
  2639.                 s++;
  2640.             fcmd->f_decimals = s-p;
  2641.             fcmd->f_flags |= FC_DP;
  2642.             } else {
  2643.             fcmd->f_decimals = 0;
  2644.             }
  2645.         }
  2646.         break;
  2647.         default:
  2648.         default_format:
  2649.         fcmd->f_type = F_LEFT;
  2650.         break;
  2651.         }
  2652.         if (fcmd->f_flags & FC_CHOP && *s == '.') {
  2653.         fcmd->f_flags |= FC_MORE;
  2654.         while (*s == '.')
  2655.             s++;
  2656.         }
  2657.         fcmd->f_size = s-t;
  2658.     }
  2659.     if (flinebeg) {
  2660.       again:
  2661.         if (s >= bufend &&
  2662.           (!rsfp || (s = str_gets(linestr, rsfp, 0)) == Nullch) )
  2663.         goto badform;
  2664.         curcmd->c_line++;
  2665.         if (in_eval && !rsfp) {
  2666.         eol = index(s,'\n');
  2667.         if (!eol++)
  2668.             eol = bufend;
  2669.         }
  2670.         else
  2671.         eol = bufend = linestr->str_ptr + linestr->str_cur;
  2672.         if (perldb) {
  2673.         STR *tmpstr = Str_new(90,0);
  2674.  
  2675.         str_nset(tmpstr, s, eol-s);
  2676.         astore(stab_xarray(curcmd->c_filestab),
  2677.             (int)curcmd->c_line,tmpstr);
  2678.         }
  2679.         if (strnEQ(s,".\n",2)) {
  2680.         bufptr = s;
  2681.         yyerror("Missing values line");
  2682.         return froot.f_next;
  2683.         }
  2684.         if (*s == '#') {
  2685.         s = eol;
  2686.         goto again;
  2687.         }
  2688.         str = flinebeg->f_unparsed = Str_new(91,eol - s);
  2689.         str->str_u.str_hash = curstash;
  2690.         str_nset(str,"(",1);
  2691.         flinebeg->f_line = curcmd->c_line;
  2692.         eol[-1] = '\0';
  2693.         if (!flinebeg->f_next->f_type || index(s, ',')) {
  2694.         eol[-1] = '\n';
  2695.         str_ncat(str, s, eol - s - 1);
  2696.         str_ncat(str,",$$);",5);
  2697.         s = eol;
  2698.         }
  2699.         else {
  2700.         eol[-1] = '\n';
  2701.         while (s < eol && isSPACE(*s))
  2702.             s++;
  2703.         t = s;
  2704.         while (s < eol) {
  2705.             switch (*s) {
  2706.             case ' ': case '\t': case '\n': case ';':
  2707.             str_ncat(str, t, s - t);
  2708.             str_ncat(str, "," ,1);
  2709.             while (s < eol && (isSPACE(*s) || *s == ';'))
  2710.                 s++;
  2711.             t = s;
  2712.             break;
  2713.             case '$':
  2714.             str_ncat(str, t, s - t);
  2715.             t = s;
  2716.             s = scanident(s,eol,tokenbuf);
  2717.             str_ncat(str, t, s - t);
  2718.             t = s;
  2719.             if (s < eol && *s && index("$'\"",*s))
  2720.                 str_ncat(str, ",", 1);
  2721.             break;
  2722.             case '"': case '\'':
  2723.             str_ncat(str, t, s - t);
  2724.             t = s;
  2725.             s++;
  2726.             while (s < eol && (*s != *t || s[-1] == '\\'))
  2727.                 s++;
  2728.             if (s < eol)
  2729.                 s++;
  2730.             str_ncat(str, t, s - t);
  2731.             t = s;
  2732.             if (s < eol && *s && index("$'\"",*s))
  2733.                 str_ncat(str, ",", 1);
  2734.             break;
  2735.             default:
  2736.             yyerror("Please use commas to separate fields");
  2737.             }
  2738.         }
  2739.         str_ncat(str,"$$);",4);
  2740.         }
  2741.     }
  2742.     }
  2743.   badform:
  2744.     bufptr = str_get(linestr);
  2745.     yyerror("Format not terminated");
  2746.     return froot.f_next;
  2747. }
  2748.  
  2749. static void
  2750. set_csh()
  2751. {
  2752. #ifdef CSH
  2753.     if (!cshlen)
  2754.     cshlen = strlen(cshname);
  2755. #endif
  2756. }
  2757.